这里介绍2个好用免费的爬虫软件—后羿采集器和八爪鱼采集器,这2个软件采集网页数据都非常简单,不用写任何代码,只需要用鼠标点击需要采集的网页信息,就会自动开始采集,非常方便,下
废话不多说,直接上干货!
1. 后羿采集器
神射手云旗下产品,有免费版和收费版【又分个人版和企业版】。这款软件制作良心,windows、mac、linux三个版本都有,新手可轻松入门。
免费版不用登录,打开后直接粘贴想要采集数据的url地址,等它自动识别,需要深入采集的,点击“深入采集”,之后在浏览器里找到需要深入的入口,进入之后,关联上需要的采集的数据字段即可。
之后点击开始采集,安安静静的等着采集数据完成导出即可。
当然,遇上有些网站有反爬机制,可能会出现采集不全,采集失效,重复采集等等问问。这时候免费版就不成了,需要的话,可以升级成收费版。
后羿采集器虽然智能好用,但网站各有不同,如果遇到有反爬机制的,小白就放弃或者找高手吧。
提到后羿采集器,就不得不提神箭手云平台。神箭手云平台有些偏重技术,对小白用户不大友好,懂技术的小伙伴倒是可以去哪里愉快的玩耍。
不过神箭手云里有很多写好的爬虫,基本都是大家喜欢的,想要获取数据的网站,有些有免费的,登录账户,拿过来用就好了。
有些比较特殊的数据采集,没有别人写过,那就需要自己动手丰衣足食了。
2. 八爪鱼采集器
八爪鱼也是业内口碑比较好的一款采集器,缺点是只有windows版本,有时候还需要安装.NET3.5 SP1。
优点是对小白友好,可以实现自动采集,数据导出。同样的,八爪鱼有免费版和收费版,功能上肯定是收费版好用。
3. Excel
对,没看错,就是大家办公室常用的、属于微软office的那款软件。Excel真是款神器,能做表,能做流程图,能作画,还能采集数据。
不过大家不要抱太大的预期,excel只能实现简单的数据采集。一般2013及以上版本可实现该功能。
数据-从HTML,之后输入url地址,就可以采集简单数据了。
如果喜欢纳兰写的内容,请收藏或关注!
作者简介:纳兰说数码,工科毕业,爱玩爱搞机,也深爱写作。关注我,咱们一起聊点有趣的数码产品或者超酷有用的APP或小程序。