- 博客(9)
- 收藏
- 关注

原创 Matplotlib的figure对象和subplot对象
**Matplotlib的figure对象和subplot对象** Matplotlib Matplotlib:是一个用于创建出版质量图表的桌面绘图包 import matplotlib.pyplot as plt pyplot模块包含Matplotlib API函数 figure Matplotlib的图像均位于figure对象中 创建figur...
2019-07-24 12:21:22
3928
1

原创 数据分析
数据分析基本概念 明确思路→数据收集《分布式爬虫实战》→数据处理→数据分析→数据展现 常用的收集途径: 公开信息,外部数据库,自有数据库,调查问卷,客户数据 数据清洗: 可读性,完整性,唯一性,权威性及合法性 常见的数据类型 1,类别型数据 (1)取值种类 (2)每类取值的分布 2,数值型变量 (1)极值和分位点 (2)均值和标准差 (3)变量间相关性 3,通用...
2019-07-18 10:59:23
232
原创 MYSQL(函数,存储体,循环)
1、函数 字符串函数 ascii(str) 返回字符串str的第一个字符的ascii值(str是空串时返回0) mysql> select ascii(‘2’); -> 50 mysql> select ascii(2); -> 50 mysql> select ascii(‘dete’); -> 100 ord(str) 如果字符串str句首是单字...
2019-12-01 22:44:53
718
原创 数据结构(顺序存储和链表存储部分)
1,线性表 1. 线性表的定义 线性表(linear list)是n(n≥0)个数据元素a1,a2,…an组成的有限序列。其中n 称为数据元素的个数或线性表的长度,当n=0时称为空表,n>0时称为非空表。通常将非空的线性表记为(a1,a2,…,an),其中的数据元素ai(1≤i≤n)是一个抽象的符号,其具体含义在不同情况下是不同的,即它的数据类型可以根据具体情况而定,我们将它的类型设定为el...
2019-11-30 23:28:43
659
原创 数据分析的三个机器学习算法
数据分析的三个机器学习算法 knn算法(邻近算法) 采用测量不同特征值之间的距离方法进行分类 优点:精度高,对异常值不敏感,无数据输入假定。 缺点:时间复杂度高,空间复杂度高。 1、当样本不平衡时,比如一个类的样本容量很大,其他类的样本容量很小,输入一个样本的时候,K个临近值中大多数都是大样本容量的那个类,这时可能就会导致分类错误。改进方法是对K临近点进行加权,也就是距离近的点的权值大,距离远的点...
2019-09-26 20:20:33
1692
原创 数据加载,存储与文件格式(非完整版)
读取文本格式的数据 pandas提供了一些用于将表格型数据读取为DataFrame对象的函数 其中read_csv和read_table用的比较多 pandas中的解析函数 函数 说明 read_csv 从文件、URL、文件型对象中加载带分隔符的数据。默认分隔符为逗号 read_table 从文件、URL、文件型对象中加载带分隔符的数据。默认分隔符为制表符(“\t”) ...
2019-08-30 23:17:58
231
原创 python推导式
列表推导式 写一个列表: squares = [] for x in range(10): squares.append(x2) print(squares) 用推导式优化后: squares = [] squares = [x2 for x in range(10)] 或者 squar = map(lambda x:x2,range(10)) 注: 第一个参数function是一个函数,第二个参...
2019-07-18 19:36:39
162
原创 数据分析简单知识点(numpy)
数据分析基本概念明确思路→数据收集《分布式爬虫实战》→数据处理→数据分析→数据展现常用的收集途径:公开信息,外部数据库,自有数据库,调查问卷,客户数据数据清洗:可读性,完整性,唯一性,权威性及合法性常见的数据类型1,类别型数据(1)取值种类(2)每类取值的分布2,数值型变量(1)极值和分位点(2)均值和标准差(3)变量间相关性3,通用数据描述(1)缺失值(2)重复性 pyth...
2019-07-11 00:25:31
209
原创 python推导式
列表推导式 写一个列表: squares = [] for x in range(10): squares.append(x2) print(squares) 用推导式优化后: squares = [] squares = [x2 for x in range(10)] 或者 squar = map(lambda x:x**2,range(10)) 注: 第一个参数function是一个函数,第二...
2019-07-11 00:10:04
381
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人