
python学习
文章平均质量分 88
九筠
这个作者很懒,什么都没留下…
展开
-
python网络爬虫开发实战之数据的存储
目录1 TXT文本文件存储1.1 实例1.2 打开方式1.3 简化写法2 JSON文件存储2.1 对象和数组2.2 读取JSON2.3 输出JSON3 CSV文件存储3.1 写入3.2 读取4 MySQL存储4.1 准备工作4.2 链接数据库4.3 创建表4.4 插入数据4.5 更新数据4.6 删除数据4.7 查询数据5 MongoDB 文档存储编辑5.1 准备工作5.2 连接MongoDB5.3 指定数据库5.4 指定集合5.5 插入数据集5.6 查询5.7 计数5.8 排序5.9 偏移编辑5.10原创 2025-04-02 14:52:44 · 738 阅读 · 0 评论 -
python网络爬虫开发实战之Ajax数据提取
目录1 什么是Ajax1.1 实例引入1.2 基本原理2 Ajax分析方法2.1 分析案例2.2 过滤请求3 Ajax分析与爬取实战3.1 爬取目标3.2 初步探索5.3 爬取列表页3.4 爬取详情页3.5 保存数据为什么使用Ajax?来源:原创 2025-04-02 15:07:54 · 227 阅读 · 0 评论 -
python网络爬虫开发实战之网页数据的解析提取
对于网页的节点来说,可以定义id、class或其他属性,而且节点之间还有层次关系,在网页中可以通过XPath或CSS选择器来定位一个或多个节点。相关的解析库也比较多,包括lxml、Beautiful Soup、pyquery、parsel等。原创 2025-03-21 15:06:49 · 1020 阅读 · 0 评论 -
python网络爬虫开发实战之基本库使用
使用urllib可以实现http请求的发送,著需要指定请求的url、请求头、请求体等。此外,urllib还可以把服务器返回的响应转换为python对象。原创 2025-03-05 18:07:34 · 840 阅读 · 0 评论 -
python网络爬虫开发实战之爬虫基础
简单点说,爬虫就是获取网页并提取和保存信息的自动化程序。获取网页:等同于获取网页源代码。提取信息:分析源代码,提取想要的数据。最通用的方法是正则表达式。保存数据:可保存为txt或json文本,也可保存到mysql和mongobd数据库,也可保存至远程服务器,借助sftp进行操作。自动化程序。原创 2025-03-06 20:00:00 · 776 阅读 · 0 评论 -
航空公司客户价值分析
其中,客户群1在特征C处的值最大,在特征 F、M 处的值较小,说明客户群 1 是偏好乘坐高级舱位的客户群:客户群2 在特征下和 M 上的值最大,且在特征R上的值最小,说明客户群 2的会员频繁乘机且近期都有乘机记录;根据客户飞行次数与总飞行公里数箱型图,客户的飞行次数与总飞行公里数也明显地分为两个群体,大部分客户集中在箱型图下方的箱体中,少数客户分收分布在箱体上界的上方,这部分客户很可能是高价值客户,因为其飞行次数和总飞行公里数明显超过箱体内的其他客户。重要发展客户:平均折扣率较高,乘坐次数和里程较低;原创 2025-02-18 21:22:14 · 778 阅读 · 0 评论 -
python数据处理——史诗级最全版本!
本实验生成三组数据,对各组数据进行统计量计算,统计量计算公式有:总数x.count()、最小值 x.min()、最小值位置 x.idxmin()、25%分位数x.quantile(.25)中位数x.median()、75%分位数 x.quantile(.75)、均值 x.mean()、最大值 x.max()、最大值位数 x.idxmax()、平均绝对偏差 x.mad()、方差x.var()、标准差 x.std()、偏度x.skew()、峰度x.kurt();plt.show()方法是将所绘制的图显示出来。原创 2025-02-17 17:56:42 · 922 阅读 · 0 评论 -
学python?看这篇就够了!
学python,这一篇就够了!(内容参考《Python编程:从入门到实践(第三版)》)原创 2025-02-17 16:34:16 · 907 阅读 · 0 评论