爬虫下载图片打不开是什么原因(爬虫下载图片代码)

爬虫，全称网络爬虫，是通过技术手段从网络获取数据的程序或脚本。人生苦短，我选python。这一次，python将用于下载一个壁纸网站的图像。本文是直接爬虫的实战。通过本文，我们将带您

本文最后更新时间： 2023-04-17 03:22:15

爬虫，全称网络爬虫，是通过技术手段从网络获取数据的程序或脚本。

人生苦短，我选python。这一次，python将用于下载一个壁纸网站的图像。

本文是直接爬虫的实战。通过本文，我们将带您了解requests库的基本用法，完成壁纸网站的图片抓取。

请求库是python中非常有用的http请求库。包装的很好~我们爬的时候经常用。

Requests的官方介绍说，让HTTP为人类服务。这是一个非常容易使用的库。我们的爬虫这次也将使用这个库。

关于requests库的介绍，请查看官方文档。

请求:让HTTP为人类服务–请求2.18.1文件

记得在使用请求库之前安装它。

pip安装请求

输入目标网站。

点击任何图片，并检查其网址，http://www.netbian.com/desk/23744.htm.

先关注这个网站，你以后会用到的。

回到浏览器，打开F12，通过目标元素检查工具点击我们刚刚点击的图像。通过它的元素，我们可以知道A标签中属性值href的链接就是我们上面访问图片的链接地址。

在大图的页面上，我们也用f12点击，找到图片的链接地址。

访问图片链接，发现是我们想要的大图。至此，网站的分析完成。

综上所述，我们的目标网站是一个壁纸图片网站，编程步骤如下:

访问主页并找到每张图片的详细信息链接。访问详细信息链接，找到对应图片的大图链接。下载并保存图片

看起来不容易吗？我们走吧。

4.1访问主页

url = & # 039http://www.netbian.com/meinv/'随手打开('index.html & # 039, 'wb & # 039)as f:通过requests库发起get请求，请求壁纸网站首页。并将结果保存在index.html文件中。

在阅读了保存的文件后，我们下载了主页。

4.2定位元件

我们在这里使用xpath。这里使用的是lxml库。如果不知道lxml库，请参考以下内容。

【Python】Xpath，爬虫分析利器，由浅入深快速掌握(附源代码示例)

PS:Google渲染的页面的xpath会和请求返回的xpath不一样。有时需要保存它用于xpath分析。

找到元素。把A标签的所有href值都拿出来，也把对应的名字拿出来。

tree = etree。HTML(resp . content)node _ list = tree . XPath('/html/body/div[2]/div[2]/div[3]/ul/Li ')if len(node . XPath('。/a/@ href '))& gt0:sub _ URL = node . XPath('。/a/@ href ')[0]if len(node . XPath('。/a/@ href '))& gt0:title = node . XPath('。/a/b/text()')[0]sub _ URL _ list . append((sub _ URL，title)) 4.3访问详细信息页面

base _ url = & # 039sub_url的http://www.netbian.com/'，sub_url_list中的标题:s _ page = base _ URL+sub _ URL s _ resp = requests . get(s _ page)with open('s.html & # 039, 'wb & # 039)为f:xxxxxxxxxxbrbbase _ URL = 'sub_url的http://www.netbian.com/'，sub_url_list中的标题:s _ page = base _ URL+sub _ URL s _ resp = requests . get(s _ page)with open('s.html & # 039, 'wb & # 039)as f:4.4定位图片链接，下载。

img = s _ tree . XPath('/html/body/div[2]/div[2]/div[3]/div/p/a/img/@ src ')[0]suffix = img . split('。')[-1]img _ content = requests . get(img)。content with open(f '。/image/{title}。{后缀} ', 'wb & # 039)作为f:xxxxxxxxxxbrimg = s _ tree . XPath('/html/body/div[2]/div[2]/div[3]/div/p/a/img/@ src ')[0]suffix = img . split('。')[-1]img _ content = requests . get(img)。content with open(f '。/image/{title}。{后缀} ', 'wb & # 039)如f:下载完效果图

4.5完整的源代码

if __name__ == '__main__': url = 'http://www.netbian.com/meinv/'with open('index.html', 'wb') as f: tree = etree.HTML(resp.content) node_list = tree.xpath('/html/body/div[2]/div[2]/div[3]/ul/li')if len(node.xpath('./a/@href')) > 0: sub_url = node.xpath('./a/@href')[0]if len(node.xpath('./a/@href')) > 0: title = node.xpath('./a/b/text()')[0] sub_url_list.append((sub_url, title)) base_url = 'http://www.netbian.com/'for sub_url, title in sub_url_list: s_page = base_url + sub_url s_resp = requests.get(s_page) s_tree = etree.HTML(s_resp.content) img = s_tree.xpath('/html/body/div[2]/div[2]/div[3]/div/p/a/img/@src')[0] suffix = img.split('.')[-1] img_content = requests.get(img).contentwith open(f'./image/{title}.{suffix}', 'wb') as f:

xxxxxxxxxxbrif __name__ == '__main__': url = 'http://www.netbian.com/meinv/'with open('index.html', 'wb') as f: tree = etree.HTML(resp.content) node_list = tree.xpath('/html/body/div[2]/div[2]/div[3]/ul/li')if len(node.xpath('./a/@href')) > 0: sub_url = node.xpath('./a/@href')[0]if len(node.xpath('./a/@href')) > 0: title = node.xpath('./a/b/text()')[0] sub_url_list.append((sub_url, title)) base_url = 'http://www.netbian.com/'for sub_url, title in sub_url_list: s_page = base_url + sub_url s_resp = requests.get(s_page) s_tree = etree.HTML(s_resp.content) img = s_tree.xpath('/html/body/div[2]/div[2]/div[3]/div/p/a/img/@src')[0] suffix = img.split('.')[-1] img_content = requests.get(img).contentwith open(f'./image/{title}.{suffix}', 'wb') as f:

妈妈再也不用担心我的学习了。if _ _ name _ _ = = & # 039_ _ main _ _ & # 039:url = & # 039http://www.netbian.com/meinv/'随手打开('index.html & # 039, 'wb & # 039)为f: tree = etree。HTML(resp . content)node _ list = tree . XPath('/html/body/div[2]/div[2]/div[3]/ul/Li ')if len(node . XPath('。/a/@ href '))& gt0:sub _ URL = node . XPath('。/a/@ href ')[0]if len(node . XPath('。/a/@ href '))& gt0:title = node . XPath('。/a/b/text()')[0]sub _ URL _ list . append((sub _ URL，title))base _ URL = 'sub_url的http://www.netbian.com/'，sub_url_list中的标题:s _ page = base _ URL+sub _ URL s _ resp = requests . get(s _ page)s _ tree = etree。HTML(s _ resp . content)img = s _ tree . XPath('/html/body/div[2]/div[2]/div[3]/div/p/a/img/@ src ')[0]suffix = img . split('。')[-1]img _ content = requests . get(img)。content with open(f '。/image/{title}。{后缀} ', 'wb & # 039)为f:xxxxxxxxxxbrif _ _ name _ _ = = '_ _ main _ _ & # 039:url = & # 039http://www.netbian.com/meinv/'随手打开('index.html & # 039, 'wb & # 039)为f: tree = etree。HTML(resp . content)node _ list = tree . XPath('/html/body/div[2]/div[2]/div[3]/ul/Li ')if len(node . XPath('。/a/@ href '))& gt0:sub _ URL = node . XPath('。/a/@ href ')[0]if len(node . XPath('。/a/@ href '))& gt0:title = node . XPath('。/a/b/text()')[0]sub _ URL _ list . append((sub _ URL，title))base _ URL = 'sub_url的http://www.netbian.com/'，sub_url_list中的标题:s _ page = base _ URL+sub _ URL s _ resp = requests . get(s _ page)s _ tree = etree。HTML(s _ resp . content)img = s _ tree . XPath('/html/body/div[2]/div[2]/div[3]/div/p/a/img/@ src ')[0]suffix = img . split('。')[-1]img _ content = requests . get(img)。content with open(f '。/image/{title}。{后缀} ', 'wb & # 039)作为f:妈妈再也不用担心我的学习了。

温馨提示：内容均由网友自行发布提供，仅用于学习交流，如有版权问题，请联系我们。

当前网址：https://www.ieqm.com/article/4299873.html

sp卡值多少钱 (特利迦的sp卡卖多少钱)答：ルトラマントリガークラマックスシ?，预计2022年3月交付。https://bandai-fashion.jp/item/item-1000169404ルトラマントリガークラマックスシ?，预计2022年3月交付。https://ba...

狗吃豆芽吗中毒可不是小事哦！答：狗吃豆芽吗狗不能吃豆芽，生豆芽会导致狗中毒，成熟的豆芽狗吃可能会导致消化不良。狗最好吃狗粮，狗粮可以满足狗生长所需的营养。豆芽中没有狗生长所需的营养物质，所以喂狗没有什...

治疗女性脊柱侧弯有什么好的方法答：治疗女性脊柱侧弯有什么好的方法可以手术矫正。也可以非手术矫正，如体操矫正姿势训练、侧方表面电刺激支具等。对于畸形小于20度的侧弯，可以通过加强锻炼，如游泳、引体向上等...

卖货的经典句子万能卖货顺口溜答：献给销售朋友，收藏起来，耐心看3遍，会有新的突破！1.客户是最好的老师，同行是最好的榜样，市场是最好的学校。只有学习别人的长处，才能比别人强。2.信任大于力量。百分之九十七的销售...

小孩拉屎流血了什么引起的(小孩拉屎流血怎么办)答：小孩拉屎流血了怎么回事孩子在大便的时候有流血的情况，很可能是因为大便干结导致了肛门黏膜损伤导致的，这就需要及时的口服通便的药物来治疗。也有的孩子是因为痔疮导致的，的...

尿酸高痛风能喝速溶咖啡吗(尿酸高能喝速溶咖啡吗?)答：前两年我的尿酸就很高了，今年直接发展成了痛风。尿酸高痛风能喝速溶咖啡吗？尿酸高痛风一般不能喝速溶咖啡。高尿酸血症以及痛风都是代谢性的疾病，需要及时对血尿酸进行控制，这...

草莓吃了有多少好处？(草莓吃了有哪些好处?)答：草莓的味道很好，口感也很好酸甜，我爱吃，吃了草莓有哪些好处？草莓：人体卫士。含有最强抗氧化力的水果大王，保护机体免遭癌患，血栓和自由基。平时日常生活中可以多吃些草莓，对身体健...

菠萝的营养功效是哪些呢？(菠萝的营养价值及功效作用)答：每到菠萝上市的季节，我就会每天买一些回家来吃，多吃菠萝好不好呢，有哪些营养功效呢？菠萝既是盛夏消暑、解渴的珍品，也是良好的减肥、健康水果。果实含有菠萝酶，有帮助消化蛋白质...

晚上做梦遗精是什么原因造成的答：已经有一个礼拜左右的时间了，我在晚上睡觉的时候出现了遗精的现象，晚上做梦遗精是什么原因造成的？晚上做梦遗精很可能是出现了前列腺炎，也不排除是在晚上睡觉之前看了一些性爱...

女人越不主动,男人越在乎是真的吗?答：在这段关系中，很多人认为当女孩主动开始时，男孩不会珍惜，也会开始变得冷，这主要取决于对方的性格，如果你真的喜欢你，或感受到你的主动性，与你互动，这种感觉是最有意义的。为什么女生...