关于python爬虫中的细节问题

Python爬虫BeautifulSoup使用细节

最新推荐文章于 2024-12-09 14:54:06 发布

原创最新推荐文章于 2024-12-09 14:54:06 发布 · 302 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python

python 专栏收录该内容

4 篇文章

订阅专栏

博客围绕Python爬虫展开，着重讲述了在使用BeautifulSoup时作者自己注意到的一个小问题，还提及有两种方式可打印出其中的字符串。

关于python爬虫中的细节问题
当我学习python爬虫用到BeautifulSoup的时候我自己注意到的一个小问题

`html = "<p><span class='bjh-p'><span class='bjh-strong'>" 
       "this is a good man</span></span></p>"
soup = BeautifulSoup(html, "lxml")
print(soup.p.prettify())
print(soup.p.span.string)

我注意到如这样的话我是打印soup.p.span.string这个的话是None但是当我把代码改这样后就可以打印其中的字符串啦

html = "<p><span class='bjh-p'><span class='bjh-strong'>" \
       "this is a good man</span></span></p>"
soup = BeautifulSoup(html, "lxml")
print(soup.p.prettify())
print(soup.p.span.string)`

或者这样

html = "<p><span class='bjh-p'><span class='bjh-strong'this is a good"             			"man</span></span></p>"
soup = BeautifulSoup(html, "lxml")
print(soup.p.prettify())
print(soup.p.span.string)

后面的两种都可以打印出其中的字符串。