xml文件数据集内容
这里可以用xpath直接提取所需的元素的值
from lxml import etree
def read_xml():
tree = etree.parse("nmt_dataset4389/dev/dev.en-zh.zh.xml")
# get bbox
for bbox in tree.xpath('//seg'): # 获取bndbox元素的内容
print(bbox.text)
read_xml()
结果: