原数据内容如下:
<SELECT id="hsCode">
<option value ="null">请选择</option>
<option value ="0209100000">[0209100000]未炼制或用其他方法提取的不带瘦肉的肥猪肉、猪脂肪( </option>
<option value ="0209900000">[0209900000]未炼制或用其他方法提取的家禽脂肪(包括鲜、冷、冻、 </option>
</SELECT>
需要通过xpath获取到的select option每一行的value和text
from lxml import etree
import json
xml_data = etree.HTML(r.text)
seat_ptions_list = xml_data.xpath('//*[@id="hsCode"]/option')
# for option in seat_ptions_list:
# print("Value is: " + option.attrib['value'])
# print("Text is: " + option.text.strip())
datas = [
{
"key": val.attrib['value'],
"val": val.text.strip(
本文介绍如何在Python中利用xpath解析HTML,提取select元素内option的value和text内容。
订阅专栏 解锁全文
4966

被折叠的 条评论
为什么被折叠?



