笔记——python—bs4 包新要求要添加标签

在学习网页信息爬取的时候发现按照教学少了点什么

图片中自己的注释已经说明了,原网页中标签<div>需要放到BeautifulSoup.find方法中的最前面,bs4的新要求(或许看老的教材也会遇到的问题)

Error Type:AttributeError: 'NoneType' object has no attribute 'text'

如果漏了的话报错页面是这样

b

 

爬取信息页面是自己用mamp pro部署的 shopxo 网页

需要的lable标签取决于自己需要查找的elements接受的最上面的标签

Traceback (most recent call last):
  File "/Users/cozyairway/PycharmProjects/Study_python/chapter_16/bs4_demo/get_news.py", line 55, in <module>
    main()
  File "/Users/cozyairway/PycharmProjects/Study_python/chapter_16/bs4_demo/get_news.py", line 50, in main
    news_detail = get_news_detail(link)
  File "/Users/cozyairway/PycharmProjects/Study_python/chapter_16/bs4_demo/get_news.py", line 41, in get_news_detail
    news_detail['content'] = soup.find('', {'class': 'am-article'}).text
AttributeError: 'NoneType' object has no attribute 'text'

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值