博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
看分享代码真蛋疼,看我写的博文不蛋疼
阅读量:6233 次
发布时间:2019-06-21

本文共 881 字,大约阅读时间需要 2 分钟。

hot3.png

import reimport urllib.request x=0def getHtml(url):    page = urllib.request.urlopen(url, None, 10000)    html = page.read()    return html def getImg(html):    global x    reg = 'alt=".+?" src="(.+?\.jpg)"'    imgre = re.compile(reg)    imglist = re.findall(imgre,html.decode('utf-8'))    for imgurl in imglist:        urllib.request.urlretrieve(re.sub(r',\d+,\d+',',800,450',imgurl),"img/%s.jpg" % x)        print ("\n"+re.sub(r',\d+,\d+',',800,450',imgurl)+"========"+"img/%s.jpg" % x)        x+=1 print ('Starting...') pages = range(1,9) for p in pages:    html = getHtml('http://m.lovebizhi.com/category/7655/%d/' % p)    print ("\n-------------------------page:%d-------------------------------" % p)    getImg(html) print ("\nDone!")

以上代码运行环境,python3.4.3,此处还有一个问题就是py3.4.3要有自动创建目录的权限,没有就在脚本的同目录下创建img目录。图片下载到哪里也可以自定义

 

非常感谢 雪梨苹果

 

转载于:https://my.oschina.net/u/252854/blog/389465

你可能感兴趣的文章
将父类activity context传递给fragment
查看>>
eclipse中导入SVN项目步骤
查看>>
2018-2019-1 20165226 《信息安全系统设计基础》第4周学习总结
查看>>
Oracle之自动收集统计信息
查看>>
互联网技术部门该如何管理
查看>>
微软2014实习生及秋令营技术类职位在线测试-题目3 : Reduce inversion count
查看>>
WebView兼容问题分析报告
查看>>
主机字节序
查看>>
【TYVJ 1056】能量项链
查看>>
手把手教你开发Windows Phone 8应用程序(序)
查看>>
hzk16在项目中的使用
查看>>
pl/sql编程(九)
查看>>
mvn项目中的pom文件提示Error parsing lifecycle processing instructions解决
查看>>
[转] react-router4 + webpack Code Splitting
查看>>
C# 集合 — Hashtable 线程安全
查看>>
Python 第一天
查看>>
检查素数的正则表达式[转]
查看>>
大话数据结构-树
查看>>
DML数据操作语言之查询(二)
查看>>
软件工程作业项目描述
查看>>