天堂图片库(下载天堂图片)
/1前言/
通常,我们要下载图片。你觉得一个一个下载很麻烦吗?有更简单的方法吗?答案是肯定的,这里我们以Paradise.com为例,批量下载Paradise.com的图片。
/2项目准备/
,第一步是安装一个pycham软件。可以参考这篇文章:Python环境构建-安利Python小白的Python和Pycharm安装详细教程。
天堂网网址:
我们需要下载几个库。我们如何下载它们?打开pycharm,依次点击文件,然后点击设置,如下图所示。
打开这个界面后,点击你的项目名(project:(你的项目名)),然后在project interpreter下,点击加号,然后下载我们需要的库,如下图所示。
这个项目需要的库是requests、lxml和fake_useragent,如下图所示。Fake_useragent一般不可用,所以需要通过以下命令安装:
pip安装fake_useragent
/3项目实施/
1.导入所需的库(requests,lxml,fake_useragent)。
2.我用封装的方法实现了各个部分的功能。先写一个框架:构造一个类天堂网站,然后在一个init方法中定义继承(self),再定义一个main方法(main)。,逐步实现这个主要方法。
3.让我们获取Paradise.com的网址并构造请求头。下面是获取这个UserAgent的方法。打开Paradise.com的网站后,按键盘上的F12键,你将进入开发者模式,然后点击网络,如下图所示。
4.然后只需单击一个名称,并在标题中复制用户代理。
5.我们点击下一页的地址,观察URL的变化,如下所示:
很明显,这个网站的页面数量一直在变化。我们可以使用格式{}来代替改变值,就像这样:
6.然后我们使用for循环遍历这些URL。代码如下:
Main (self): for I in range (1,2): #页数。客户可以随机设置URL=self . URL . format(I)print(URL)。
7.我们定义这个get_home()方法来请求这个URL。
9.我们需要解析获得的数据,然后定义一个xiap方法并获得我们请求的URL。接下来是项目的关键。
10.到目前为止,我们已经提前做好了反爬虫措施的准备。接下来,我们将分析网页的结构并提取网页图片的地址数据,并批量下载解析的图片地址,这将在我们的下一篇文章中详细说明。
/4摘要/
本文的主要内容是对图片网站做一个基本的介绍。基于Python中的爬虫库请求、lxml和fake_useragent,提前部署了请求头来模拟浏览器,并提前做好了反爬虫措施的准备。
下篇文章将带你了解网页结构的分析和网页图片地址数据的提取,并批量下载解析出的图片地址,敬请期待~ ~
往期精彩文章推荐:
教你如何用Python发现隐藏的wifi。
教你如何用Python制作一个可视化的“剪刀石头布”游戏。
教你如何用Python批量创建复工证书。
版权声明本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 www.mianfo.com 举报,一经查实,本站将立刻删除。
本文地址
http://www.diemang.com/post/252896.html
版权声明本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 907991599@qq.com 举报,一经查实,本站将立刻删除。