自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

嘿梨的博客

Data Visualisation和Machine Learning方向学习中

  • 博客(7)
  • 收藏
  • 关注

原创 Python text()函数--可视化注释

Python text()函数–可视化注释text(x, y, str, weight, color, size, rotation, ha)str: 注释文本的内容参考:https://www.jb51.net/article/180087.htm

2021-02-03 16:03:10 448

原创 Reset_index()

Reset_index()reset_index可以还原索引,重新变为默认的整型索引DataFrame.reset_index(level=None, drop=False, inplace=False, col_level=0, col_fill=”)level控制了具体要还原的那个等级的索引drop为False则索引列会被还原为普通列,否则会丢失参考链接:https://blog.youkuaiyun.com/weixin_44056331/article/details/89340626?utm_me

2021-02-03 15:59:30 779

原创 显示数据列太多被隐藏了怎么办

显示数据列太多被隐藏了怎么办import pandas as pdpd.set_option('display.max_columns', None)

2021-01-30 18:59:43 359

原创 数据筛选

数据筛选# 读取数据import pandas as pddata = pd.read_csv('...')根据年份范围筛选drop_row_index = data[data['Year'] > 2015].indexdata = data.drop(drop_row_index)# 查看数据筛选后的sizedata.shape

2021-01-29 20:01:59 157

原创 Python数据分析常用的第三方扩展库

Python数据分析常用库Numpy, Scipy, Matplotlib, Pandas, Scikit-Learn, Keras, Gensim.通过pip安装# 以numpy为例pip install numpyNumpy提供多维数组功能,以及对数据进行快速处理的函数。Scipy提供矩阵,以及大量基于矩阵运算的对象和函数。功能:最优化、线性代数、积分、插值、拟合、信号处理和图像处理、常微分方程求解等。参考链接:http//www.scipy.org/Matplotlib

2021-01-28 15:04:16 1553

原创 常用的数据挖掘建模工具

常用的数据挖掘建模工具(1)SAS Enterprise(2)IBM SPSS Modeler(3)SQL Server(4)Python(5)WEKA - 开源机器学习和数据挖掘软件(Java)(6)KNIME (Java)(7)RapidMiner (Java)(8)TipDM (Java)

2021-01-28 14:33:22 483

原创 数据挖掘的基本任务与建模过程

基本任务:分类与预测、聚类分析、关联规则、时序模式、偏差检测、智能推荐等。建模过程:1. 定义挖掘目标2. 数据取样:随机抽样、等距抽样、分层抽样、从其实顺序抽样、分类抽样3. 数据探索4. 数据预处理:数据筛选、数据变量转换、缺失值处理、坏数据处理、数据比爱准话、主成分分析、属性选择、数据归约等。5. 挖掘建模:选用那种算法进行模型构建。6. 模型评价...

2021-01-28 14:32:54 984

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除