
数据分析
文章平均质量分 56
OceanProo
花即花雾即雾
展开
-
利用python进行数据分析_从删库到跑路
目录前言一 numpy模块1.numpy的数据结构:多维数组ndarray数组转置和轴对换矩阵内积通用函数利用数组进行数据处理(矢量化)将条件逻辑表述为数组运算数组和统计法方法 约简排序sort唯一化和其他集合逻辑数组中的集合运算用于数组的文件输入输出线性代数随机数生成部分numpy.random函数随即漫步数组重塑扁...原创 2018-10-19 09:35:46 · 2585 阅读 · 0 评论 -
python之random
如果你对在Python生成随机数与random模块中最常用的几个函数的关系与不懂之处,下面的文章就是对Python生成随机数与random模块中最常用的几个函数的关系,希望你会有所收获,以下就是这篇文章的介绍。random.random() 生成随机数In [33]: import randomIn [34]: random.random() #生成0-1的随机浮点数Out[34]...原创 2018-11-20 13:16:29 · 211 阅读 · 0 评论 -
python之pyechart
Echarts是百度可视化工具,pyecharts 是一个用于生成 Echarts 图表的类库。Echarts 是百度开源的一个数据可视化 JS 库。用 Echarts 生成的图可视化效果非常棒,为了与 Python 进行对接,方便在 Python 中直接使用数据生成图官方教程:http://pyecharts.org/#/zh-cn/prepare支持图形Bar(柱状图/条形图) ...原创 2018-11-21 19:09:22 · 7612 阅读 · 2 评论 -
python之matplotlib无法显式中文
1.Linux环境:确认mpl-data路径下的font/ttf目录,并将下载的中文字体文件复制到该目录下,然后重启电脑1@1:~$ locate -b 'mpl-data'/home/zelin/anaconda3/lib/python3.7/site-packages/matplotlib/mpl-data/home/zelin/anaconda3/pkgs/matplotlib...原创 2018-11-14 20:21:44 · 414 阅读 · 0 评论 -
python之pandas
目录目录1.生成数据表读取csv文件构建DataFrame2.数据信息查看和索引查看DataFrame的基本信息索引3.数据可视化可视化:matplotlib.pyplot绘图可视化:pandas绘图制图实例4.数据清洗缺失值处理字符串处理数据转换:格式转换和异常值处理重复项重命名索引离散化5.数据规整丢弃数据...原创 2018-11-08 13:15:24 · 954 阅读 · 0 评论 -
python之jieba
中文分词调用jieba的cut对中文字符串进行分词即可,返回一个生成器In [1]: import jiebaIn [2]: strings='直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或 ...: 频率,宽度则表示各组的组距,其高度与宽度均有意义'In [3]: data=jieba.cut(strings)In [4]: type(data)Ou...原创 2018-11-13 16:20:52 · 624 阅读 · 0 评论 -
python之数据可视化
各种图形简介线性图:plt.plot(x,y,*argv)条形图:plt.bar(x,y)x和y的长度应相等水平条形图:plt.barh(x,y)x轴成垂直,y轴水平而已条形图高度表示某项目内的数据个数,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列直方图:plt.hist(x),数据集种各数据出现的频数/频率图2d直方图:plt.hist2d(...原创 2018-11-13 15:39:07 · 1352 阅读 · 0 评论 -
python之numpy
@numpy1.15.1数据科学的基础库0维,标量1维,向量2维,矩阵3维,两个矩阵生成数组array,生成数组In [43]: import numpy as npIn [44]: np.array([1,2,3,4])Out[44]: array([1, 2, 3, 4])shape,形状ndim,维度dtype,数据类型size,数据...原创 2018-11-07 10:37:49 · 290 阅读 · 0 评论 -
python之数据清洗脚本
#coding=utf-8import numpy as npimport pandas as pdna_list=['NO CLUE','N/A','0']#na包含的类型data=pd.read_csv('311-service-requests.csv',na_values=na_list,dtype={'Incident Zip':str})#列值数据类型设置为字符串#prin...原创 2018-11-09 19:44:24 · 1215 阅读 · 0 评论 -
支持向量机
目录简介计算过程scikit-learn实现简介支持向量机(SVM,Support Vector Machine)是一组用于分类(SVM), 回归(SVR)和异常值检测的监督学习方法。支持向量机的优点是:在高维空间有效。 在尺寸数量大于样本数量的情况下仍然有效。 在决策函数中使用训练点的子集(称为支持向量),因此它也具有内存效率。 多功能:可以为决策功能指定不同...原创 2018-11-22 11:23:38 · 408 阅读 · 0 评论