Python 学习之路（一）

最新推荐文章于 2025-09-14 09:25:36 发布

原创最新推荐文章于 2025-09-14 09:25:36 发布 · 211 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#Python #爬虫 #网络数据采集

python爬虫专栏收录该内容

8 篇文章

订阅专栏

本篇博客介绍了一个简单的Python爬虫程序，该程序使用requests库和BeautifulSoup库从腾讯新闻首页抓取新闻标题及对应的链接。通过定位特定HTML元素，能够有效地解析并输出所需数据。

#coding:utf-8
import requests  #引入库
from bs4 import  BeautifulSoup

url = 'http://news.qq.com'
wbdata = requests.get(url).text
soup = BeautifulSoup(wbdata,'lxml')  #BS4库解析
news_titles = soup.select('div > div > em > a')  #获取标题的定位
for n in news_titles:
        title = n.get_text()
        link = n.get('href')
        data = {
            '标题':title,
            '链接':link,
        }