抓图软件安卓下载(scrapy抓美图,so easy!)

scrapy是个啥?(详细内容可自行google)

Scrapy是一个为了爬取网站数据,提取结构性数据而编写的python框架。

环境:centos7、python2.7

第一步:安装pip,下载get-pip.py(

https://bootstrap.pypa.io/get-pip.py),在命令行中输入下面命令即可:

# python get-pip.py

第二步:验证pip是否安装成功(看见下图即安装成功,忽略红色,哈哈)

# pip list

pip安装成功

第三步:安装scrapy(这个才是重点,没出现error就ok咯)

# pip install scrapy

scrapy安装成功

第四步:初始化pr【我爱线报网】52线报网-专注分享活动首码线报优惠券零投网赚项目oject

# scrapy startproject meitu

初始化一个scrapy项目名字是meitu

第五步:创建一个spider(在刚刚创建的project下面执行下面命令,meinv是爬虫的名字,随便起不要和project相同就好,www.mm131.com/xiaohua/是一个美图的网址)

# cd meitu

# scrapy genspider meinv www.mm131.com/xiaohua/

之后,在文件夹meitu/spider下面出现meinv.py文件,如下图,

接下来就是改造它了;

第六步:改造结果如下

第七步:运行以下命令,获得结果,图片位置在(meitu/pic)

#s【我爱线报网】52线报网-专注分享活动首码线报优惠券零投网赚项目crapy crawl meinv

分析:在第六步中出现的改造完的meinv.py文件,其中导入了scrapy(用它爬去图片链接)和urllib(用它下载链接美图)两个包,在MeinvSpider中:

name是这个spider的名字;

allowed_domains是允许爬去的域名(只会爬去这个域名下的链接);

start_urls是爬虫启动时第一次请求的链接;

parse函数中的response其实是请求start_urls完成后返回的结果,用xpath(不难,随便研究下可以写了)匹配出美图链接;

urllib.urlretrieve(url,./pic/+str(self.number)+.jpg)【我爱线报网】52线报网-专注分享活动首码线报优惠券零投网赚项目是把分析出来的美图下载下来,存到pic目录下面(需要自己创建下);

self.number+=1是为了避免每次下载的图片名字相同,导致图片被覆盖。

结语:scrapy还有不少功能,才开始学习,慢慢研究了!

推荐阅读

给力项目线报网会员可免费下载 加入会员
友情提醒: 请尽量登录购买,防止付款了不发货!
QQ交流群:226333560 站长微信:qgzmt2
温馨提示:本站提供的一切软件、教程和内容信息都来自网络收集整理,仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负,版权争议与本站无关。用户必须在下载后的24个小时之内,从您的电脑或手机中彻底删除上述内容。如果您喜欢该程序和内容,请支持正版,购买注册,得到更好的正版服务。我们非常重视版权问题,如有侵权请邮件与我们联系处理。敬请谅解!

给TA打赏
共{{data.count}}人
人已打赏
行业资讯

武汉樱花售后服务电话(双态IT武汉樱花论坛 | 定了!就在下个月)

2024-4-9 11:33:17

行业资讯

都是6缸发动机,l6和v6哪个更强一点(都是6缸发动机,L6和V6哪个更强?)

2024-4-9 11:54:04

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索