在目前的站长圈内,比较流行的采集工具有很多,但是总结起来,比较出名的免费的就这么几个:火车头,海纳,ET,三人行,狂人。
下面我们对这几款采集工具作一个简单的评比。
1.火车头 基本上人人都知道,那就放第一位,要多说两句。
火车头应该是国内采集软件最成功的典型之一,使用人数包括收费用户数量上应该是最多的
特色:简单,功能强大,速度快,支持的网站最丰富,支持丰富扩展
优点:功能比较齐全,采集速度比较快,主要针对cms,短时间可以采集很多,过滤,替换都不错,比较详细;很多人写接口、规则和发布模块,接口比较齐全,其中有个叫尘缘的人,几乎开发目前所有PHP类CMS的接口;支持的扩展非常好用,如果你是一位懂技术的站,可以使用PHP或者C#开发任意功能的扩展,实再令人好生难忘;附件采集功能完善。
技术:技术主要是论坛支持,帮助文件多,上手容易。有收费、免费版本
缺点:功能增多,软件越来越大,比较占用内存和CPU资源,资源回收控制得不好
2.三人行(狂人) 主要针对论坛的采集,功能比较完善
先申明,不知道三人行和狂人是什么关系,但界面和功能都是一个模子出来的。
特色:针对各大论坛,搬家,移动,速度快,准确度高
优点:还是针对论坛,适合开论坛的
技术:收费技术,免费有广告
缺点:超级复杂,上手难,对cms支持比较差
3.ET工具
特色:无人值守,稳定,资源占用最低,基本上可以叫安静
优点:无人值守,自动更新,适合长期做站,用户群主要集中在长期做站潜水站长。软件清晰,必备功能也很齐全,关键是软件免费,听说已经增加采集中英文翻译功能。
技术:论坛支持,软件本身免费,但是也提供收费服务。帮助文件较少,上手不容易
缺点:对论坛和CMS的支持一般
4.海纳
特色:海量,关键词抓取,可以预览采集内容,不用写规则
优点:海量,可以抓取网站很多一个关键词文章,似乎适合做网站的专题,特别是文章类、博客类
技术:无论坛 收费,免费有功能限制
缺点:分类不方便,也就说采集文章归类不方便,要手动(自动容易混淆),特定接口,采集的内容有限
5.狂人
特色:可以让你的新论坛一开始就会有大量的会员.
优点:非常适合采集discuz论坛
缺点:过于专一,兼容性不好。
总结:追求功能齐全的,似乎应该选择火车头,火车头被称之为“无所不能”,初期作站,可以迅速采集很多的资源,充实网站内容。如果做论坛,那选
择三人行,没错了,可以实现采集论坛,回复,搬家等多项论坛功能。长期做站,当然选择ET了,花点时间,弄懂,是个长期受益的事情。写好规则,设置好过滤
替换,然后可以像开QQ一样,长期运行,不费内存,自动采集更新,分类明确,采集内容完整,可是说,一个站,一个站长+ET足够了。至于海纳,似乎不写规
则,上手容易,但是对文章的发布上,不能如ET一劳