python图片小爬虫详解编程语言

import re   
import urllib   
import os   
   
def rename(name):    
    name = name + '.jpg'   
    return name     
   
def getHtml(url):   
    page = urllib.urlopen(url)   
    html = page.read()   
    return html   
   
def getImg(html):   
    reg = r'src="(.+?/.jpg)" pic_ext'   
    imgre = re.compile(reg)   
    imglist = re.findall(imgre,html)   
       
       
    os.chdir("E://pic")     
    os.getcwd()    
    x=1   
    for imgurl in imglist:   
        img=urllib.urlopen(imgurl)   
             
           
        name=str(x)     
        name = rename(name)     
        print(name)    
        x=x+1   
           
        f=open(name,'wb')   
        f.write(img.read())    
        f.close()   
    
    
    
       
html = getHtml("http://tieba.baidu.com/p/3553148164")   
getImg(html)   
print 'pic save!'  

原创文章,作者:Maggie-Hunter,如若转载,请注明出处:https://blog.ytso.com/8198.html

(0)
上一篇 2021年7月18日
下一篇 2021年7月18日

相关推荐

发表回复

登录后才能评论