python怎么匹配这个div下面的ul 下面的 li 下面的 a连接和文字

2024-11-01 20:57:50
推荐回答(1个)
回答1:

解析HTML,最好不要使用正则表达式

而是使用专门的HTML解析器,比如Python的lxml包

举个例子如何获取id

from lxml import etree

url = 'xxx'
doc = etree.parse(url)
div = doc.xpath('//div[@class="car-familylist"]')
ids = list(map(lambda e:int(e.attrib[id][-4:]),div))