request库笔记

1.第一节课大体介绍requests

import requests

r = requests.get("http://weixin.sogou.com/")       #request.get基本就能爬取所有的网页了
print(r.status_code)                               #这个status是200代表成功了,不是200就失败了

print(r.apparent_encoding)                         #apparent_encoding是用内容分析出来的编码方式
r.encoding = r.apparent_encoding                   #encoding是在报头里面看到的编码方式,不如上一个准,有的报头里有有的没有
print(r.text)

2.通用框架(这一段代码可以无限抄)

import requests

def getHTMLText(url):
    try:
        r = requests.get(url,timeout =30)
        r.raise_for_status()                       #如果status值不是200,就返回异常
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return "产生异常"

#python的异常捕获,用try和except来做。在try里面如果发生了异常(异常大概就是程序运行不下去了),捕获到了异常之后,运行except里面的程序。

3.HTTP协议,超文本传输协议。请求与响应模式的无状态的传输协议。

HTTP协议通过URL对资源进行管理,get是获取资源,head是获取头部信息,这两个方法重点掌握。

更改资源,patch,put,delete,post

patch可以局部更新资源,put是全盘覆盖,post可以被存到表单等数据下。

传输资源其实是严格受控的,也就是那四个传输的请求很难被实现,get是最常用的方法,去爬取一些内容。

4.反反爬虫程序

网站方对于爬虫是可以拒绝的,拒绝方式可能是看请求源的header数据,如果header源是由浏览器给出的可以,如果是爬虫就拒绝。

import requests

def getHTMLText(url):
    try:
        kv = {'user-agent':'Mozilla/5.0'}
        r = requests.get(url,timeout =30,headers = kv)      #构造一个键值对,然后把这个赋值给headers就能骗过去,尤其注意这里是headers,有s
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return "产生异常"

5. 爬取百度和360等搜索结果

import requests

url = "https://www.baidu.com/s"
def getHTMLText(url):
    try:
        kv = {'wd':'Python'}
        r = requests.get(url,params = kv)                   #构造一个键值对,把搜索的那一部分传入进去
        r.raise_for_status()                                #不同搜索网站的键值对值wd可能不一样,自己去看一下
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return "产生异常"

getHTMLText(url)

网站上面的图形交互界面是方便人类使用的,但其实后台的提交都是利用链接的形式来提交的。

如果能知道后台api提交的链接,那就可以用python程序去模拟提交这个请求。

6. 图片爬取的全代码

import requests
import os

url = "******.jpg"
root = "D://123//"
path = root + url.split('/')[-1]

try:
    if not os.path.exists(root):
        os.mkdir(root)
    if not os.path.exists(path):
        r = requests.get(url,timeout =30)
        with open(path,'wb') as f:
            f.write(r.content)
            f.close()
            print("文件保存成功")
    else:
        print("文件已存在")
except:
    print("爬取失败")

(1)网络上很多的资源都是这样的格式,比如图片,视频,原理都是一样的

(2)split函数是字符串的一个函数

str = "sjsdjfaja123648b sdf52.1"
print(str.split('1'))

a = str.split()
print(a[1])

首先定义一个字符串,然后str.split,默认的分割是按照空白,可能是空格可能是换行,用空白来分割,如果在split的括号里输入了东西,那就按照这个东西来分割。

split方法前面进去的时候是一个字符串,返回是一个数组,分割完了之后好多元素,切成了数组。

被当成分隔符的那个东西,不管是人为输入还是空格,在返回的数组里面都不会存在,直接被删掉了,然后前后断开。

(3)I/O操作

with open('/path/to/file', 'r') as f:
    print(f.read())

这里with的作用是把文件用完了之后自动关闭,如果没有with的话,标准流程就是先open,再read,再close。

用了with之后就不担心close的问题了。

 

 

小结:

爬虫的视角:网络上的任何内容,不管是内容的获取还是请求的发送,都是有一个url存在的,只要能够获取这个url,什么都可以做到。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

<think>首先,用户的问题是:“我想在Jupyter中安装requests 请问如何在Jupyter Notebook中安装requests”。这涉及到在Jupyter Notebook环境中安装Python。 根据系统级指令: - 所有行内数学表达式必须使用$...$格式,但这个问题不涉及数学表达式,所以可能不需要。 - 独立公式必须使用$$...$$格式并单独成段,但同样,这个问题不涉及数学公式。 - LaTeX语法正确:确保任何数学部分正确使用LaTeX。 - 使用中文回答:整个回答必须用中文。 - 生成相关问题:在回答结束后,添加相关问题。 - 回答中引用的段落末尾自然地添加引用标识:如果引用内容,添加[^1]等。 用户可见层指令: - 回答结构清晰,帮助用户逐步解决问题。 - 保证回答真实可靠。 参考提供的引用: - [^1]: 提到在cmd中使用pip3 install requests等命令。 - [^2]: 描述Jupyter Notebook的功能。 - [^3]: 详细说明如何在Windows上安装,包括pip install命令和启动Jupyter。 - [^4]: 提示升级pip。 用户的问题是关于在Jupyter Notebook中安装requestsrequests是一个Python HTTP。 关键点: - 在Jupyter Notebook中安装,通常有两种方式: 1. 使用系统终端或命令提示符(cmd)安装。 2. 直接在Jupyter Notebook中使用魔法命令(magic commands)安装。 从引用[^1]和[^3]中,可以看到使用pip install命令在命令行中安装。 具体步骤: 1. 打开命令提示符(cmd)或终端。 2. 确保Python环境正确,pip可用。 3. 运行命令:pip install requests 或 pip3 install requests(如果使用Python 3)。 4. 然后启动Jupyter Notebook。 在Jupyter Notebook内部,可以使用!pip install requests,因为!前缀允许在notebook中运行shell命令。 引用[^3]提到:在cmd中运行pip install requests,然后启动Jupyter。 引用[^4]提示升级pip,所以建议用户先升级pip。 回答结构: - 逐步指导用户如何安装。 - 提供两种方法:从外部命令行安装和从Jupyter Notebook内部安装。 - 确保语言为中文。 - 结束时生成相关问题。 生成相关问题: - 基于主题:Jupyter Notebook、Python安装、requests使用等。 - 例如: 1. 如何在Jupyter中安装其他? 2. requests的基本用法是什么? 3. Jupyter Notebook的常见问题解决? 完整回答大纲: 1. 介绍:确认用户需求。 2. 方法一:从命令行安装。 - 打开cmd或终端。 - 运行pip install requests。 - 启动Jupyter。 3. 方法二:从Jupyter Notebook内部安装。 - 在代码单元格中运行!pip install requests。 4. 验证安装:在Jupyter中导入requests测试。 5. 相关问题。 添加引用:如果引用内容,添加[^1]等。例如,提到引用中的命令时。 最终回答用中文。</think>### 如何在Jupyter Notebook中安装requests 在Jupyter Notebook中安装Python(如requests)有两种常用方法:**通过外部命令行安装**或**直接在Jupyter Notebook中使用魔法命令安装**。requests是一个用于发送HTTP请求的Python工具,常用于网络爬虫或API调用[^2]。以下我将逐步指导您完成安装过程,确保操作简单可靠(基于Python 3环境)。 #### 方法一:通过外部命令行安装(推荐,适用于所有系统) 这是最稳定的方式,需要先安装Python和pip。以下是详细步骤: 1. **打开命令提示符(cmd)或终端**: - Windows用户:按`Win + R`键,输入`cmd`后回车。 - macOS/Linux用户:打开“终端”应用。 2. **安装requests**: 在命令行中输入以下命令: ```bash pip install requests ``` 如果使用Python 3,建议优先使用: ```bash pip3 install requests ``` - **注意**:如果pip版本过旧,系统可能提示升级(如`You are using pip version 8.1.1, however version 9.0.0 is available`)。建议先升级pip以避免兼容性问题: ```bash python -m pip install --upgrade pip ``` 然后再运行`pip3 install requests`[^4]。 3. **启动Jupyter Notebook**: 安装完成后,在命令行输入: ```bash jupyter notebook ``` 这会自动打开浏览器进入Jupyter主页[^3]。 4. **验证安装**: 在Jupyter中新建一个Python 3笔记本(`New > Python 3`),在代码单元格输入: ```python import requests print(requests.__version__) # 输出版本号,如"2.31.0"表示成功 ``` 运行单元格(按`Shift + Enter`),若无错误则安装成功。 #### 方法二:直接在Jupyter Notebook中安装(快速方法) 如果您已经打开了Jupyter Notebook,可以使用内置的魔法命令(magic commands)安装: 1. **在Jupyter中新建或打开一个笔记本**。 2. **在代码单元格中输入并运行**: ```python !pip install requests ``` - 如果使用Python 3,优先尝试: ```python !pip3 install requests ``` - 此命令会直接调用系统的pip工具,输出类似`Successfully installed requests-2.31.0`表示成功[^1]。 3. **验证安装**: 在同一笔记本中新建单元格,输入并运行: ```python import requests response = requests.get("https://www.example.com") print(response.status_code) # 输出200表示HTTP请求成功 ``` #### 常见问题解决 - **权限错误**:如果在命令行安装时遇到权限问题,尝试添加`--user`参数: ```bash pip install requests --user ``` - **安装失败**:确保网络连接正常,或使用国内镜像加速(如清华源): ```bash pip install requests -i https://pypi.tuna.tsinghua.edu.cn/simple ``` - **Jupyter未找到命令**:确认Jupyter已正确安装(参考引用[^3]中的安装步骤)。 通过以上方法,您可以轻松在Jupyter Notebook中使用requests进行网络操作。如果您已安装但导入失败,重启Jupyter内核通常可解决问题[^1]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值