import reimport urllib.request x=0def getHtml(url): page = urllib.request.urlopen(url, None, 10000) html = page.read() return html def getImg(html): global x reg = 'alt=".+?" src="(.+?\.jpg)"' imgre = re.compile(reg) imglist = re.findall(imgre,html.decode('utf-8')) for imgurl in imglist: urllib.request.urlretrieve(re.sub(r',\d+,\d+',',800,450',imgurl),"img/%s.jpg" % x) print ("\n"+re.sub(r',\d+,\d+',',800,450',imgurl)+"========"+"img/%s.jpg" % x) x+=1 print ('Starting...') pages = range(1,9) for p in pages: html = getHtml('http://m.lovebizhi.com/category/7655/%d/' % p) print ("\n-------------------------page:%d-------------------------------" % p) getImg(html) print ("\nDone!")
以上代码运行环境,python3.4.3,此处还有一个问题就是py3.4.3要有自动创建目录的权限,没有就在脚本的同目录下创建img目录。图片下载到哪里也可以自定义
非常感谢 雪梨苹果