#coding:utf-8 import requests #引入库 from bs4 import BeautifulSoup url = 'http://news.qq.com' wbdata = requests.get(url).text soup = BeautifulSoup(wbdata,'lxml') #BS4库解析 news_titles = soup.select('div > div > em > a') #获取标题的定位 for n in news_titles: title = n.get_text() link = n.get('href') data = { '标题':title, '链接':link, }
print(data) #打印出数据
本篇博客介绍了一个简单的Python爬虫程序,该程序使用requests库和BeautifulSoup库从腾讯新闻首页抓取新闻标题及对应的链接。通过定位特定HTML元素,能够有效地解析并输出所需数据。

被折叠的 条评论
为什么被折叠?



