#coding:gb2312
import os
import lxml
import lxml.etree,StringIO
import lxml.html as x
if __name__ == '__main__':
filelist = os.listdir("/backup/ksearch/query/videos/youku_new/info/")
for filename in filelist:
filepath = "/backup/ksearch/query/videos/youku_new/info/" + filename
f= open(filepath, "r")
c=f.read()
doc=lxml.etree.parse(StringIO.StringIO(c))
alist=doc.xpath("/Videos/Video/wid")
print len(alist)
for a in alist:
print a.text
使用lxml解析xml
最新推荐文章于 2025-05-29 15:05:11 发布
本篇博客介绍了一个使用Python和lxml库从文件中解析Youku视频信息的方法。通过读取指定目录下的文件,利用XPath获取视频ID,并打印出来。该脚本展示了如何处理XML格式的数据。
1013

被折叠的 条评论
为什么被折叠?



