自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

嘿梨的博客

Data Visualisation和Machine Learning方向学习中

  • 博客(7)
  • 收藏
  • 关注

原创 Python text()函数--可视化注释

Python text()函数–可视化注释 text(x, y, str, weight, color, size, rotation, ha) str: 注释文本的内容 参考: https://www.jb51.net/article/180087.htm

2021-02-03 16:03:10 480

原创 Reset_index()

Reset_index() reset_index可以还原索引,重新变为默认的整型索引 DataFrame.reset_index(level=None, drop=False, inplace=False, col_level=0, col_fill=”) level控制了具体要还原的那个等级的索引 drop为False则索引列会被还原为普通列,否则会丢失 参考链接: https://blog.youkuaiyun.com/weixin_44056331/article/details/89340626?utm_me

2021-02-03 15:59:30 808

原创 显示数据列太多被隐藏了怎么办

显示数据列太多被隐藏了怎么办 import pandas as pd pd.set_option('display.max_columns', None)

2021-01-30 18:59:43 410

原创 数据筛选

数据筛选 # 读取数据 import pandas as pd data = pd.read_csv('...') 根据年份范围筛选 drop_row_index = data[data['Year'] > 2015].index data = data.drop(drop_row_index) # 查看数据筛选后的size data.shape

2021-01-29 20:01:59 180

原创 Python数据分析常用的第三方扩展库

Python数据分析常用库 Numpy, Scipy, Matplotlib, Pandas, Scikit-Learn, Keras, Gensim. 通过pip安装 # 以numpy为例 pip install numpy Numpy 提供多维数组功能,以及对数据进行快速处理的函数。 Scipy 提供矩阵,以及大量基于矩阵运算的对象和函数。 功能:最优化、线性代数、积分、插值、拟合、信号处理和图像处理、常微分方程求解等。 参考链接: http//www.scipy.org/ Matplotlib

2021-01-28 15:04:16 1655

原创 常用的数据挖掘建模工具

常用的数据挖掘建模工具 (1)SAS Enterprise (2)IBM SPSS Modeler (3)SQL Server (4)Python (5)WEKA - 开源机器学习和数据挖掘软件(Java) (6)KNIME (Java) (7)RapidMiner (Java) (8)TipDM (Java)

2021-01-28 14:33:22 508

原创 数据挖掘的基本任务与建模过程

基本任务: 分类与预测、聚类分析、关联规则、时序模式、偏差检测、智能推荐等。 建模过程: 1. 定义挖掘目标 2. 数据取样:随机抽样、等距抽样、分层抽样、从其实顺序抽样、分类抽样 3. 数据探索 4. 数据预处理:数据筛选、数据变量转换、缺失值处理、坏数据处理、数据比爱准话、主成分分析、属性选择、数据归约等。 5. 挖掘建模:选用那种算法进行模型构建。 6. 模型评价 ...

2021-01-28 14:32:54 1030

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除