如何优化Python爬虫的速度？

你可以先评估一下自己的爬虫是io密集还是cpu密集。
io密集:程序大部分时间花在了io等待上，比如网络io，即http请求等，磁盘io，即文件读写等。
cpu密集: 程序大部分时间花在了cpu计

本文最后更新时间： 2023-02-09 09:40:46

你可以先评估一下自己的爬虫是io密集还是cpu密集。

io密集:程序大部分时间花在了io等待上，比如网络io，即http请求等，磁盘io，即文件读写等。

cpu密集: 程序大部分时间花在了cpu计算上，比如文本处理，数值计算等。

如果是io密集，那么你可以将这部分的功能通过线程池或者协程池进行并发，这样就提升了速度。

不过这里的网络io有个前提，你的带宽不是你爬虫的瓶颈。

如果是cpu密集，那么可以把这部分工作通过进程池(多进程)进行并行处理，这样就提升了速度。多进程则意味着你的机器是多核的。

不过还有一些地方是值得优化的，比如一些库的选择上，例如beautifulsoup虽然很方便，但是有更快的实现方式，比如selectolax的速度要快很多。

如果你无法判断，那么就先多线程，然后多进程吧。

如果是单机解决不了，就用工作队列吧，比如celery。多机并行，一定能提升速度，而且是水平扩展的，当然了，这得让你的任务能够分布式。

1/2 1 2 下一页尾页

温馨提示：内容均由网友自行发布提供，仅用于学习交流，如有版权问题，请联系我们。

当前网址：https://www.ieqm.com/news/1084237.htmll

申请建行信用卡额度是多少？答：...

英国留学签证如何准备？答：1、签字后的在线签证申请表（在线填写并递交后，打印出来签名）； 2、签字后的附表8自我评估表Appendix 8 self-assessment form（General Student）； 3、至少六个月有效期的现有护照——...

20200424股市如何分析，20200427股市如何预测，怎么样？答：今天两市小幅缩量下跌，酒类，猪肉和旅游酒店上涨，如果说酒类、猪肉是因消费被关注持续上涨，那么旅游酒店就是板块轮动的逻辑了。这个板块上涨行情很难延续，主要今年业绩肯定很难看...

那些能用洛必达法则解的高考压轴题，怎么把洛必达法则翻译成常规的数学语言？答：这要看个人情况，压轴题有难度，如果自己基础好，考试时有时间，那就对新构成的函数单调性讨论，在根据极限，求导去做，如果时间紧，考试没有时间，就别对函数讨论，直接求极限，求导，过程不完整，但...

端午节公司发什么福利？答：...

微信小程序加盟代理如何赚钱（如何代理小程序）答：如何代理小程序（微信小程序加盟代理如何赚钱）在如今的互联网时代里，想要快速实现财富自由，一定要抓住新风口，而代理小程序是新风口，也是新的财富密码。那么代理小程序如何赚钱？...

贾浅浅的12首诗（贾浅浅的诗歌引质疑）答：贾浅浅的诗歌引质疑（贾浅浅的12首诗）原创历史解忧号2021-05-09 09:00 贾浅浅诗歌事件之所以能够如此长时间地持续发酵，与这三大原因是分不开的：一，来头大，身为贾平凹之女，天生自...

网上哪里能买到雪茄（雪茄为什么不能过肺）答：每次看到电影《赌神》里面，周润发梳着大背头、脖子上围着白色围巾、带着黑色墨镜、嘴里叼着一根大雪茄，酷酷的微笑，伴随着经典音乐出场的镜头，那一瞬间觉得他真的帅呆了！特别是那...

小米官方登录网站（小米手环时间怎么调）答：小米手环4息屏显示时间怎么设置息屏时长调整方法步骤小米手环4如何设置息屏时间？小米手机想要设置息屏时长，太长或者太短都不符合自己的习惯，该怎么自定义设置呢？下面我们就来...

花盆的小蜈蚣怎么灭答：许多人的家中都是会有效盆栽花盆种花，可是种花需要注意按时看有生虫，要不然盆栽花卉不可以身心健康生长发育不用说，还会严重影响大家在房间里的正常的生活。例如盆栽花盆里边若...

你可能感兴趣

甄嬛和钮祜禄·甄嬛是一个人吗？

北约为何不解散？

张国立老师代言的“众安保险”大家觉得可以买吗？

一个女孩可以不顾一切地追求一个男孩吗？

nba名人堂能进多少人？

伊藤美诚Pk中国女乒69次胜率第一、李隼指导的男队又输球，你认为这都是偶然吗？

印度疫情是瞒而不报，还是真的没有那么多呢？

口口声声说爱你的男人，会谈了五年却不愿跟你结婚吗？