python爬虫

最新推荐文章于 2025-09-11 22:10:09 发布

转载最新推荐文章于 2025-09-11 22:10:09 发布 · 54 阅读

·

0

·

文章标签：

#python #爬虫

这里使用的是xpath这个第三方python库

使用 from lxml import etree 导入

使用：

select = etree.HTML(html)

content = select.xpath()

for each in content:

　　print each

一个简单的demo：

from lxml import etree


html = '''
<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>Title</title>
</head>
<body>
    <input id='name1' href = 'www.hao123.com'></input>
    <input id='name2'></input>
        xxxx


</body>
</html>
'''
select = etree.HTML(html)

content = select.xpath("//body/input[@id='name1']/@href")

for each in content:
    print each
print "end"

weixin_33726313

博客等级

码龄10年

158
原创

256
点赞

1334
收藏

7563
粉丝

关注

私信

热门文章

上一篇：: UIResponder

下一篇：: React动画实践

最新评论

大不列颠百科全书Encyclopaedia Britannica Ultimate 2014光盘镜像
homo114514echou: 《大英百科全书2007》创始于1768年，现在美国出版，是一部历史悠久，连续修订，享誉世界的权威性、学术性综合百科全书，内容涵盖政治、经济、哲学、文学、艺术、社会、语言、宗教、民族、音乐、戏剧、美术、数学、物理、化学、历史、地理、地质、天文、生物、医学、卫生、环保、气象、海洋、新闻、出版、电视、广播、广告、军事、电脑、网络、航空、体育、金融等二百多个学科。《大英百科全书2007》大英百科全书的悠久历史，注定了它在数字化的犹豫。它一直以来都是靠书籍发行得以生存并巩固独一无二的权威性。大英百科全书2006开始，大英百科全书看到了百科全书只有一个未来，那就是人们不仅仅需要一套百科全书摆在家里充门面，而是迫切需要不断地学习充电，赶上时代发展的步伐。最值得一提的是大英百科全书2006版引入了BrainStormer，把满天繁星的知识点编织成一个个迷人的星座图。人们不仅能从一个知识点链接到另一个知识点，而且能让知识发散性思维，从而引发灵感，推动创造力。《大英百科全书2007》版更引入了 Virtual Notecards，让人们能更好的整理知识，提高学习效率。大英百科全书在2006版已经青出于蓝而胜于蓝了。大英百科全书与Microsoft Encarta的比较： Microsoft Encarta的诞生，确实让我眼前一亮。它完完全全把文字性的工具书变成了一个活泼生动的多媒体交互软件。有视频动画，有3D虚拟观光，有游戏测验，有网址链接。但是Encarta从2006版起，就要屈身于所谓的Student，与Word等等软件结合起来，组成一个供学生做作业，写论文的平台。本来Encarta所用的文字就很浅显生动，让人们能轻松学到新知识，但是现在，我很怀疑Encarta能否电子百科全书的代名词，总觉得它越来越幼稚了。孩子是未来，激发他们对万事万物的好奇心，引导他们探索未知的广阔世界，这是个神圣的荣耀。但是，成人更需要一本好的电子百科全书，需要一个整理知识，扩展知识的平台。 Encyclopedia Britannica 大英百科全书的历史西元1751年到1780年,法国大学者狄德罗 (Denis Diderot 1713-1784),网罗了当时启蒙时代的184位学者专家以三十年时间编印完成的「科学艺术及专业知识百科全书」,是全世界第一套「现代百科全书」.
大不列颠百科全书Encyclopaedia Britannica Ultimate 2014光盘镜像
homo114514echou: 11123
Linux服务器的SSH连接使用
魔法学徒q: 请问ssh连一个服务器，用ssh -p 端口号用户名@ip地址的方法，隔了一会出来connection timed out是为什么？
FPGA Verilog HDL 系列实例--------步进电机驱动控制
m0_66680866: 你好第32行42行能解释一下什么意思吗？
echarts的时间线图表
若水000: 小主，没有结果显示和代码解释好可惜啊，看不懂啊

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。