Python爬虫爬取图片问题 用正则规则匹配到一个网页的所有图片的网址规则,请问如何用遍历把正则

2024-11-02 17:39:20
推荐回答(1个)
回答1:

# encoding: UTF-8 
import re 
 
# 将正则表达式编译成Pattern对象 
pattern = re.compile(r']*src[=\"\']+([^\"\']*)[\"\'][^>]*>', re.I) 
 
# 使用search()查找匹配的子串,不存在能匹配的子串时将返回None 
match = pattern.search('hello world!') 
 
if match: 
    # 使用Match获得分组信息 
    print match.group(1)