
python-数据分析
似水灬流年
学到新东西,看到不一样的世界
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Pyecharts之多维数据可视化
1.柱状图多维数据较一维加一个y轴坐标from pyecharts.charts import Barfrom pyecharts import options as optsbar = Bar()y1 = [28, 32, 15, 45]x2 = ['美女', '模特', '公主', '学生']y2 = [20, 30, 10, 40]bar.add_xaxis(x2)bar....原创 2020-02-28 21:49:21 · 2103 阅读 · 0 评论 -
python之Pyecharts基础
1.生成图片Pyecharts是1.5.0版本,其他版本不保证代码可执行性代码from pyecharts.charts import Barfrom pyecharts import options as optsbar = Bar()x = list(range(1, 6))y = [111, 120, 130, 142, 150]bar.add_xaxis(x)bar.a...原创 2020-02-26 13:15:13 · 2319 阅读 · 1 评论 -
Python数据分析--Numpy
1.用Python语言描述KMP算法 def kMP( t,p,pnext): j, i=0,0 n, m=len(t), len(p) while j < n and i < m: #i==m 说明找...原创 2019-03-27 14:37:59 · 535 阅读 · 1 评论 -
Python数据分析之NumPy (2)
一.数组的索引和切片1.数组的轴这里我们举一个例子 import numpy as np a=np.arange(24).reshape ((2,3,4) ) a 输出 array( [ [ [0,1,2,3 ], [4,5,6,7], [8,9,10,11] ], ...原创 2019-03-27 18:58:24 · 359 阅读 · 0 评论 -
Python数据分析---Numpy (3)
一.针对数组的操作1.数组的变形我们经常用 reshape ( )方法来变形数组例如 import numpy as np np.arange( 10 ) 输出是0到9的一维数组 np.arange( 10 ).reshape ( (2, 5 ) ) 输出为 array ( [ [0,1,2,3,4], [5,6,7,8,9] ] ...原创 2019-04-01 17:32:43 · 210 阅读 · 0 评论 -
Python数据分析之Numpy (4)
一.运算和通用函数1.算术运算数组支持加减乘除四则运算除法也是一样原则上讲,只有形状相同的数组才能进行四则运算;但是可以通过 “广播”的形式进行临时转换,使其可以进行运算从上面的实验可以清楚看到,不同形状之间不能进行运算;但是当数组最内部元素个数相同时,通过广播,就可以进行运算了;而且数组还可以和列表进行运算,算法相同2.比较运算和逻辑运算(1)比较运算和4则运算相同,比较的是...原创 2019-04-02 15:25:52 · 454 阅读 · 0 评论 -
Python数据分析之Numpy (5)
一.矩阵1.创建矩阵有两种方法创建矩阵,分别是np.mat ( ) 和 np.matrix ( )创建时,一个中括号和两个中括号没区别因为,矩阵必须是二维的矩阵的组合由此看出,bmat方法可以组合矩阵若将分号去掉,会得到如下结果会改变矩阵形状补充:矩阵的参数可以是字符串,数组,列表等2.矩阵的乘法a=[ [0,1,2], [3,4,5], [6...原创 2019-04-03 18:08:35 · 362 阅读 · 0 评论 -
Python之数据分析----Pandas基础和应用
一.Pandas简介 Pandas是一个用于数据分析的Python第三方库,Pandas在Numpy的基础上,优化了数据结构,在数据的存储、读取、分割、转换等方面进行了改进,使操作更简单。 Pandas在数据结构上具有优势,是数据分析的标配。...原创 2019-04-05 15:28:31 · 250 阅读 · 0 评论 -
Pandas---索引对象,数据索引和切片
一.索引对象Pandas 相对 Numpy的一大变化就是丰富了数据的索引及其方法Series 和 DataFrame 的索引----index对象 和 MultiIndex对象1.index对象每个 Series 对象都有一个 index 属性,通过此属性就能得到 index 对象默认索引依旧从0开始,索引值也可以修改但请注意下面问题为什么会报错呢,这是因为索引是一个属性...原创 2019-04-07 16:12:53 · 632 阅读 · 0 评论 -
Pandas-------文件读写操作和处理缺失数据
一.文件读写操作1.csv定义:逗号分隔值有时也叫做字符分隔值,其文件以纯文本形式存储表格数据,纯文件意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。csv文件常常用于保存数据,Pandas提供了对该文件进行读写操作的方法。开始,这里我们简单介绍一下 pd.read_csv( )其部分参数如下 参数 数据类型 ...原创 2019-04-08 15:06:48 · 1297 阅读 · 0 评论 -
Pandas-------规整数据和分组运算
一.规整数据1.轴向连接默认情况下是沿0轴连接,当然也可以指定当两个数组元素个数不同时,会用 NaN 代替指定轴连接方向为1轴设定多级索引可能出出现这种情况例如,设定的索引名相同,但不对应,连接时会如何呢?结果是按照对应索引名称连接2.合并数据 pd.merge()函数一个有意思的函数作用:按照索引方向取交集按照维度方向取并集注意这两个的差别3.组...原创 2019-04-27 17:51:55 · 177 阅读 · 0 评论 -
Pandas-------矢量化字符串与时间
1.矢量化字符串对字符串的一些操作变小写,求长度等当然也支持索引和切片一.时间在Python中有对时间的描述,datatime模块,这里使用的是 pytz1.时间的物理量(1)地区时间的转换当然对于时间,也是可以“ 计算的 ”值得注意的是,在计算时需要通过参数指定地区信息结果是时间间隔(2)时间单位的转化2.比较相关的模块看一个有趣的事情那么,当numpy...原创 2019-04-28 15:58:12 · 391 阅读 · 0 评论 -
数据可视化----设置坐标系
应用工具----Matplotlib1.在Jupyter中绘图执行上述命令后,就会弹出一个图片窗口分别是sin()和cos()函数图像2.面向对象画图首先创建 Figure对象 fig=plt.figure( ) 此语句执行后后出现一块 “白布” 即一个空画板二.设置坐标系1.坐标网格只需要添加最后一行代码,并且能设置图像颜色这里我改变了 x 的定义,重新...原创 2019-04-28 17:12:19 · 1771 阅读 · 0 评论 -
数据可视化---------绘制图像
1.曲线在坐标系内,如果知道了X和Y之间的对应关系————函数,就能画出此函数的图像,即函数曲线——直线是一种特殊的曲线例如绘制曲线,并通过参数确定线的样式对应关系如下 名称 solid dashed dashdot dotted ...原创 2019-04-29 15:22:23 · 965 阅读 · 0 评论 -
数据可视化--------常用统计图与三维图像
一.统计图 plot()函数能够画出各种函数曲线 scatter()能够画出散点图 是时候了解统计图了1.柱形图 pld.bar(x, height, width=0.8, bottom=None, hold=None, data=None, **kwargs) 柱形图中 “柱子” 的基本位置和长、宽,是由 x、height、width、bottom确定的...原创 2019-05-02 13:46:19 · 5288 阅读 · 0 评论 -
初识机器学习------线性回归
1.线性回归的拟合首先我在 data.csv中写了几条数据,判断 id 和 money 之间的关系将他制作成散点图这个图,很容易让我们想到它是否满足某种函数关系,下面分别看看它和一次,二次函数的拟合度计算一次函数的各项系数看图或许会更形象我们看到,这个曲线和散点已经非常接近了,那是不是就是他的函数关系呢?先不急下结论,我们再看看二次函数和上面的构造方法类似如出一...原创 2019-05-05 16:32:11 · 239 阅读 · 0 评论 -
机器学习2----Logistic回归
1.认识Sigmoid函数 y=1/(1+ e的-z次方)这就是Sigmoid函数首先把它画出来由图可知,z=0时,y=0.5。z 越大,y 越趋近 1 ,反之趋近 0所以我们可以将对象分为两类,0和1设置条件,如果 y大于0.5,则 y=1 ,反之 y=02.分析 Iris 的类型这里有现成的 Iris 数据,我们直接拿来用我们可以看到有...原创 2019-05-07 12:58:03 · 154 阅读 · 0 评论