解析HTML,最好不要使用正则表达式
而是使用专门的HTML解析器,比如Python的lxml包
举个例子如何获取id
from lxml import etreeurl = 'xxx'doc = etree.parse(url)div = doc.xpath('//div[@class="car-familylist"]')ids = list(map(lambda e:int(e.attrib[id][-4:]),div))