Python数据挖掘与分析
文章平均质量分 65
岁月辰星
.NET研发工程师
Vue前端开发工程师
医疗信息化研发
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
8. Python数据处理工具——Pandas
Pandas模块可以解决数据的预处理问题,如数据类型的转换、缺失值的处理、描述性统计分析、数据的汇总等。本章学习的重点两种重要的数据结构,即序列和数据框。如何读取外部数据(如文本文件、电子表格或数据库中的数据)。数据类型转换及描述性统计分析。字符型与日期型数据的处理。常见的数据清洗方法。如何应用iloc、loc与ix完成数据子集的生成。实现Excel中的透视表操作。多表之间的合并和连接。数据集的分组和聚合操作。序列和数据框的构造Pandas模块的核心操作对象就是序列(Series原创 2021-01-29 13:27:42 · 361 阅读 · 0 评论 -
7. 伪随机数的生成
虽然Python内置的random模块中可以生成随机数,但是每次只能随机生成一个随机数,但是每次只能随机生成一个数字,而且随机数的种类也不够丰富。函数说明seed(n)设置随机种子beta(a,b,size=None)生成贝塔分布随机数chiquare(df,size=None)生成卡方分布随机数choice(a,size=None,replace=True,p=None)从a中有放回的随机挑选指定数量的样本exponential(scale=1.0,s原创 2021-01-29 13:27:10 · 695 阅读 · 0 评论 -
6. 线性代数的相关计算
numpy模块可以解决各种线性代数相关的计算,只不过需要调用Numpy的子模块linalg,该模块几乎提供了线性代数所需的所有功能。函数说明函数说明np.zeros生成零矩阵np.eye生成单位矩阵np.dot计算两个数组的点积np.diag矩阵主对角线与一维数组间的转换np.linalg.det计算矩阵行列式np.linalg.eigvals计算方阵特征根np.linalg.pinv计算方阵的Moore-Penrose伪逆np.linalg原创 2021-01-29 13:26:58 · 1148 阅读 · 0 评论 -
5. 数组的基本运算
Numpy模块中可以实现数组的基本运算。#加法运算math = np.array([12,34,23,56,78,34])english = np.array([56,67,23,45,12,67])chinese = np.array([1,2,4,5,23,12])sum_result1 = math + english + chinesesum_result2 = np.add(np.add(math,english),chinese)print('符号加法:',sum_result1)原创 2021-01-29 13:26:49 · 1187 阅读 · 0 评论 -
4. Python数值计算工具 Numpy
Numpy模块数组的创建与操作数组的基本数学运算常用数学和统计函数线性代数的求解伪随机数的创建4.1 数组的创建和操作数组的创建#导入模块,并重命名为npimport numpy as np#单个列表 创建一位数组arr1 = np.array([1,34,6,87,3,56,8,23,4])#嵌套元素创建二维数组arr2 = np.array(((2,4,2,45.7,6),(7,4,6,8,3),(1,2,34,4,5),(7,8,98,5,23)))print('一维数原创 2021-01-29 13:26:33 · 270 阅读 · 0 评论 -
3.自定义函数
用一个自定义的猜数字函数来说明自定义函数怎么写。#自定义函数def game(min,max): import random number = random.randint(min, max) #产生一个需要猜的数字 while True: guess = float(input("请在%d到%d之间才一个数字:"%(min,max))) #if 分至判断下一轮应在什么范围内猜数字 if guess < number:原创 2021-01-29 13:26:24 · 231 阅读 · 0 评论 -
2.Python 控制流 + 字符串处理方法
2. 控制流2.1 if分支score = int(input("请输入你的分数:"))if score == 100: print("恭喜你!满分!")elif score >= 90: print("优秀!")else: print("良好")OUT:请输入你的分数:100恭喜你!满分!请输入你的分数:92优秀!请输入你的分数:78良好2.2 循环2.1.1 for循环list = [1,4,2,6,8,9,3,10]result = [原创 2021-01-29 13:26:13 · 379 阅读 · 2 评论 -
1.Python快速入门
1.1 数据结构及方法1.1.1 列表列表是一种存储数据的容器。列表中的元素是不受任何限制的,可以存放数值、字符串及其他数据结构的内容。列表是一种序列,即每个列表元素是安装顺序存入的。列表是一种可变类型的数据结构,即可以实现对列表的修改,包括增加、删除和修改列表中的元素值。“列表是一种序列”指的是可以通过索引(或下标)的方式实现列表元素的获取,Python中的索引都是英文状态下的方括号表示,而且,对于位置索引来说,都是从0开始的。下面有四种常见的索引方式。1、正向单索引list1 = [原创 2021-01-29 13:26:01 · 820 阅读 · 4 评论
分享