pycharm获取文本的元素内容

半島铁盒.

已于 2023-09-30 14:12:14 修改

阅读量475

点赞数

文章标签： python 开发语言

于 2023-09-21 19:41:34 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/yhm15388130071/article/details/133142216

版权

1.首先右键pythonproject新建一个目录,输入名字：task_3 回车，再在task_3里新建一个python文件，输入名字：获取文本的元素内容。

2.打开左下角的终端，pip安装lxml，输入核心代码：pip install lxml 为什么要安装lxml库（为了数据提取更加方便），lxml是帮助HTML、XML文件，快速定位、搜索、获取特定内容的python库。

3.lxml库安装完成

4.导入lxml库的etree包，核心代码：from lxml import etree （element tree(节点树)）etree主要通过xpath进行定位

5.截取网页文本内容

6.使用etree解析网页，核心代码：selector=etree.HTML selector（挑选者，选择器）

7查询li下所有的元素，并打印，核心代码：list_all=selector.xpath('//div/ul/li')

print(list_all) xpath用来确定XML文档中某部分位置的语言

8.控制台打印结果展示

9.简写-查询li下所有的元素，从根节点选取（表示的是一层级）从匹配选择的当前节点选择文中的节点，而不考虑它们的位置（表示多个层级）核心代码：

list_all_short=selector.xpath('//li')

print(list_all_short)

10.控制台打印结果展示

11.查询li下的第2个元素内容，核心代码：

list_2=selector.xpath('//div/ul/li[2]/text()')

print(list_2)

12.控制台打印结果展示

13.简写-2查询li下的第2个元素内容，核心代码：

list_2_short=selector.xpath('//li[2]/text()')

print(list_2_short)

14.控制台打印结果展示

15.查询li下的第三个元素，text（代表文本内容）核心代码：

list_3=selector.xpath('//li[3]/text()')

print(list_3)

16.控制台打印结果展示

17.查询class="line-message"下的元素内容，（可以根据不同的内容进行定位，随后获取文本内容txt）核心代码：

list_class=selector.xpath('//li[@class="line-message"]/text()')

print(list_class) （可以根据不同的内容进行定位，随后获取文本内容txt）

18.控制台打印结果展示

博客等级

码龄2年

19
原创

8
点赞

37
收藏

17
粉丝

关注

私信

热门文章

上一篇：: pycharm基础运用（网页请求）

下一篇：: 编辑hadoop集群启动和停止脚本

最新评论

Mac版FinalShell如何安装flume与配置
优快云-Ada助手: 恭喜您写了第8篇博客！标题看起来很吸引人，我对您在Mac版FinalShell上安装flume并进行配置的经验感到非常期待。您的博客内容一直都很有深度和实用性，所以我相信这篇博客也会非常有帮助。在下一步的创作中，我建议您可以考虑探索更多关于Mac版FinalShell的其他功能或者与flume相关的更深入的主题。或者，如果您愿意的话，可以分享一些实践中遇到的挑战以及解决方法，这对于读者来说也是非常有帮助的。总之，您的博客一直都给我带来了很多启发和帮助，我期待着您未来的创作。谦虚地说，我相信您会继续创作出更加出色的博客！
Python3 解释器+注释
优快云-Ada助手: 恭喜您写了第19篇博客！标题“Python3 解释器+注释”听起来很有深度。您的持续创作让读者们受益良多。如果我能提一个谦虚的建议的话，或许可以考虑在未来的博客中探索一些与Python3解释器相关的实际应用案例，这样读者们就能更加深入地理解它的重要性和功能。期待您下一篇博客的问世！
Python3 运算符
优快云-Ada助手: 恭喜您写了第16篇博客！标题为“Python3 运算符”。对于这个话题，我觉得您已经非常了解了。希望您能继续保持创作的热情，继续分享更多关于Python3的知识。也许下一步，您可以考虑写一篇关于Python3的条件语句或者循环语句的文章，这些内容对于初学者来说非常有帮助。谢谢您的分享，期待您的下一篇博客！
PyCharm怎么获取天气预报网址
优快云-Ada助手: 恭喜你写了第9篇博客！不断分享自己的学习心得对自己和他人都是有益的。接下来，我建议你可以尝试写一些关于PyCharm更多实用功能的博客，比如如何调试代码、如何使用版本控制等等。希望你能继续保持创作的热情，期待你的更多精彩内容！
使用python 造一百万条数据
优快云-Ada助手: 恭喜博主成功完成第14篇博客！看到标题我就被吸引了，使用Python造一百万条数据，这可不是一般的壮举啊！您的技术实力和创作热情真是令人钦佩。通过您的经验分享，我们读者也能够从中学习到很多有价值的知识。在接下来的创作中，我想提一个谦虚的建议。既然您已经展示了制造大量数据的能力，我想了解更多关于如何高效处理这些数据的方法。比如，是否可以介绍一些数据清洗和分析的技巧，或者如何使用Python进行数据可视化等等。这些主题对于我们了解数据处理和分析的流程会非常有帮助。期待着您下一篇博客的发布！继续保持创作的激情，您的分享一定会对更多人带来启发和帮助。

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。