爬虫之爬取新浪新闻

本文介绍了一个使用Python爬取新浪新闻API的具体实例。通过发送GET请求获取新闻数据,并利用JSON解析返回的内容,最终打印出每条新闻的URL及标题。此教程适合初学者学习如何进行简单的网络爬虫操作。
#-*- coding:utf-8 -*-

import requests
import json
import pandas as pd

headers = {
'User-Agent':'Mozilla/5.0 (Windows NT 6.1; W…) Gecko/20100101 Firefox/61.0'
}

res = requests.get('https://feed.sina.com.cn/api/roll/get?pageid=121&lid=1356&num=20&versionNumber=1.2.4&page=1&encode=utf-8&callback=feedCardJsonpCallback&_=1554687410372')
res.encoding = 'utf-8'
a = str(res.text)
res1 = a.split("try{feedCardJsonpCallback(")[1].split(");}catch(e){};")[0]
b = json.loads(res1)

news = {}

w = b['result']['data']
for i in w:
    print(i['url'] + " " + "--- " + i['title'])
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值