python实践 - 自创

最新推荐文章于 2025-06-30 14:54:53 发布

原创最新推荐文章于 2025-06-30 14:54:53 发布 · 184 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#python #数据分析 #其他 #程序人生

python基础同时被 3 个专栏收录

12 篇文章

订阅专栏

6 篇文章

订阅专栏

1 篇文章

订阅专栏

本文介绍了Python在数据清洗和业务分析中的应用，包括删除缺失值、转换数据类型、特征选择、描述性统计和数据可视化。通过数据处理，如处理缺失值、删除重复特征，以及对特定列的操作，来优化数据集。此外，文章还探讨了通过groupby进行分类分析，绘制饼图以了解各分类的占比，并利用TF-IDF算法进行关键词抽取。

部署运行你感兴趣的模型镜像

Python 的数据处理

- Python 的数据清洗
- - Python 的数据业务分析

Python 的数据清洗

1.数据处理，查看数据是都有缺失值，缺失大于0.98 全部删除那列。
在这里插入图片描述
2. 特征值一模一样的进行删除。

3. 依据逻辑删除不可能会用的列，建模不会用到的。

4. 某列缺失值高于80%,不属于业务问题的也可直接删除，如果是特征先保留，观察。

再次查看数据清洗后的特征，用a. isna().mean()。

6.查看数据类型，日期的转化为日期，数量转化为整数，价格为小数，文本 = object 。
在这里插入图片描述
7.修改类型
df23.astype({’*贝ID’:‘object’}) 将原数据的id 类型用字典形式进行astype({ a,a.value}) 进行修改。
df23.reset_index(drop=True,inplace=True) 去掉之前的索引，重置索引，这里从0开始。

8. 将df 进行描述性统计的转置，方便观察。
在这里插入图片描述
9.查看前几行的数据。

Python 的数据业务分析

查看各种类品的重要指标销量，销售额，利润之和，通过 groupby 进行分类。

2.查看各类之间的分布。

3.byclass.plot.pie(autopct=’%.2f’) 表示通过品类分类表示去掉 % ，保留.2 位小数点，表示占位。

4.选择 df [df["类别]==“A”] 表示选择A类的进行分析。

5.将这一品类售价描述并画图。

6.价格之间的区间划分。

7.各宝贝之间得竞争力度。
销售额贡献度更青睐于*猫。
提取排名前5%得销售额。

10.分析找出市场销售额高，而相对竞争力度小得产品。

11.市场份额较高的是相对竞争力度较大的。
非中英文字符。

13.-基于 TF-IDF 算法的关键词抽取

您可能感兴趣的与本文相关的镜像

Python3.8

Python3.8

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

博客等级

码龄6年

14
原创

4
点赞

21
收藏

3
粉丝

关注

私信

热门文章

分类专栏

python基础 12篇
sql 3篇
可视化 2篇
pandas基础 6篇
excel 1篇
算法 1篇
numpy 1篇

展开全部收起

上一篇：: Python 的可视化

下一篇：: Python 的模块及构建

大家在看

[内网流媒体] 用 HTTP 把实时画面送进浏览器

最新文章

AI算力推荐

Python3.8

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

Conda

Python

目录

展开全部

收起

AI算力推荐

Python3.8

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

Conda

Python

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。