
python
X_dmword
数据与生活同在
展开
-
Python数据抽样
1、数据的导入查看 参考参考 import pandas as pd f = open("E:/test.csv", encoding="utf-8") content = pd.read_csv(f,nrows=5) ##打印(读取)前5行 print(content) ##等价 print(content[0:5])左闭右开,输出0-4序号行 import pandas ...原创 2019-03-20 17:10:10 · 2732 阅读 · 0 评论 -
Python数据清洗
1、缺失值的处理 准备:pandas、numpy、sklearn.preprocessing中的Imputer类 import pandas as pd import numpy as np from sklearn.preprocessing import Imputer data = pd.DataFrame(np.random.randn(6, 4), columns=['col1'...原创 2019-03-17 12:14:38 · 1009 阅读 · 0 评论 -
python小笔记(2)
1、range和yield range:range([start,] stop[, step]),根据start与stop指定的范围以及step设定的步长,生成一个序列。 yield:创建生成器,产生值,类似return,不过函数不会因为yield而结束,只是将流程控制权转交给函数调用者。 for i in range(3): print(i) for j in range(0...原创 2018-06-04 19:45:11 · 264 阅读 · 0 评论 -
python小笔记(1)
——致初学python的小白,高手请忽略,哈哈 1、format(格式化函数) ##代码 print('{:<15}'.format('hello word!'))#左对齐 print('{:^15}'.format('hello word!'))#居中 print('{:>15}'.format('hello word!'))#右对齐 print('{:@>15}'.fo...原创 2018-06-04 15:48:17 · 420 阅读 · 0 评论 -
Python数据的相关性和标准化
1、相关性分析 协方差:Cov(X,Y)=E(XY)-E(X)E(Y) 或cov(X, Y) = E(X-EX)(Y-EY),表示两个变量总体误差的期望,范围在负无穷到正无穷。协方差为0时,两者独立。协方差绝对值越大,两者对彼此的影响越大,反之越小 公式简单翻译一下是:如果有X,Y两个变量,每个时刻的“X值与其均值之差”乘以“Y值与其均值之差”得到一个乘积,再对这每时刻的乘积求和并求出均值(...原创 2019-03-21 20:37:39 · 3839 阅读 · 0 评论 -
python、pycharm、anaconda区别
1、python python自身缺少numpy、matplotlib、scipy、scikit-learn....等一系列包,需要我们安装pip来导入这些包才能进行相应运算(python3.5自带了get-pip.py,不需额外下载安装),在cmd终端输入:pip install numpy就能安装numpy包了。每次都额外安装所需要的包略麻烦,这时候我们可以采用anaconda了。 2、A...原创 2019-03-27 16:47:09 · 8378 阅读 · 0 评论 -
Python图形
Gallery页面中有上百幅缩略图,打开之后都有源程序。因此如果你需要绘制某种类型的图,只需要在这个页面中浏览/复制/粘贴一下,基本上都能搞定。 https://python-graph-gallery.com/all-charts/ 1、折线图 import matplotlib.pyplot as plt import numpy as np # 绘制折线图 squares ...原创 2019-03-27 17:59:11 · 1133 阅读 · 0 评论