Python 爬虫入门——requests

本文介绍如何使用Python的requests库进行网页爬取。作者正在自学Python,并通过编写爬虫程序来放松。文章详细解释了requests库的安装和使用方法,包括设置请求头和获取网页内容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近笔者忙着考研,高数搞得头大。想着写点程序放松下自己。

我自己最近在自学python ,感觉爬虫挺有意思。

当然,爬下网页还需要数据处理。这个我会在以后的文章中讲到。今天讲的是关于requests爬取网页。

首先大家需要安装 requests 库

如下:

pip installl requests

然后我们在requestsDemo.py  写如下代码:

#coding:utf-8

#导入requests库

import requests

#定义方法 用来爬去网页

def spiderDemo(url):

headers = {
'User-Agent':'Mozilla/5.0(compatible;MSIE 9.0;Windows NT 6.1; Trident/5.0',
'Accept-language':'zh-CN,zh;q=0.8'

}

#发送请求并返回

response = requests.get(url,headers=headers)

#得到一个html   网页

html = response.text
return html
if __name__==('__main__'):
url = raw_input('请输入你想怕爬取的url')
html = spiderDemo(url)

print html

 

 

#大家可以运行python requestsDemo.py

输入一个网址  就可以成功抓取页面的内容

        

基于html+python+Apriori 算法、SVD(奇异值分解)的电影推荐算法+源码+项目文档+算法解析+数据集,适合毕业设计、课程设计、项目开发。项目源码已经过严格测试,可以放心参考并在此基础上延申使用,详情见md文档 电影推荐算法:Apriori 算法、SVD(奇异值分解)推荐算法 电影、用户可视化 电影、用户管理 数据统计 SVD 推荐 根据电影打分进行推荐 使用 svd 模型计算用户对未评分的电影打分,返回前 n 个打分最高的电影作为推荐结果 n = 30 for now 使用相似电影进行推荐 根据用户最喜欢的前 K 部电影,分别计算这 K 部电影的相似电影 n 部,返回 K*n 部电影进行推荐 K = 10 and n = 5 for now 根据相似用户进行推荐 获取相似用户 K 个,分别取这 K 个用户的最喜爱电影 n 部,返回 K*n 部电影进行推荐 K = 10 and n = 5 for now Redis 使用 Redis 做页面访问次数统计 缓存相似电影 在使用相似电影推荐的方式时,每次请求大概需要 6.6s(需要遍历计算与所有电影的相似度)。 将相似电影存储至 redis 中(仅存储 movie_id,拿到 movie_id 后还是从 mysql 中获取电影详细信息), 时间缩短至:93ms。 十部电影,每部存 top 5 similar movie 登录了 1-6 user并使用了推荐系统,redis 中新增了 50 部电影的 similar movie,也就是说,系统只为 6 为用户计算了共 60 部电影的相似度,其中就有10 部重复电影。 热点电影重复度还是比较高的
评论 15
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值