中国科学院自动化所笔试题
1、网络爬虫的种类有那些:他们的原理,区别,和特征是什么 2、网络爬虫的主流数据库有那些,说说他们的特性 3、写一个排除重复连接和外部链接的算法 4、爬虫抓取过程中,如何处理跳转,和验证 5、如何解决被抓取的主机验证频率。