Python下的爬虫库,一般分为3类。 抓取类 urllib(Python3),这是Python自带的库,可以模拟浏览器的请求,获得Response用来解析,其中提供了丰富的请求手段,支持Cookies、Headers等各类
1.不用框架的话,强烈推荐requests库,这个库是真的唉urllib这些库好用
2.用框架的话,用scrapy,毕竟现在的一个主流,资料也多
我也在学习python爬虫,大家一起努力