python使用BeautifulSoup采集新浪新闻
from bs4 import BeautifulSoup
import requests
url="http://roll.finance.sina.com.cn/finance/zq1/ssgs/index.shtml"
res=requests.get(url)
res.encoding='gb2312'
soup=BeautifulSoup(res.text,'html.parser')
for news in soup.select('.list_009 li'):#爬取新闻列表
title=news.select('a')[0].text#新闻标题
time=news.select('span')[0].text#时间
print(title,time)
采集结果:


本文介绍了一种使用Python中的BeautifulSoup库抓取新浪新闻的方法。通过requests库获取网页内容,并利用BeautifulSoup解析HTML,实现对新闻标题及发布时间的批量抓取。
5119

被折叠的 条评论
为什么被折叠?



