1.提取同名多标签中最后一个标签的文本 PyQuery.eq(index)
豆瓣TOP250中提取评价人数:
text='''
<div class="star">
<span class="rating5-t"></span>
<span class="rating_num" property="v:average">9.7</span>
<span property="v:best" content="10.0"></span>
<span>2029026人评价</span>
</div>
'''
doc = PyQuery(text)
doc('.star span').eq(

本文介绍了如何使用PyQuery库在Python中解析HTML并提取数据,特别是面对同名多标签的情况,通过PyQuery.eq(index)方法获取最后一个标签的文本。同时,针对标签不完整和文本中包含拉丁空格xa0及换行符
的问题,提出了通过split方法进行处理的方法,以正确地提取和清理数据。
最低0.47元/天 解锁文章





