- 博客(15)
- 收藏
- 关注
原创 Task04 线性代数
线性代数Numpy 定义了 matrix 类型,使用该 matrix 类型创建的是矩阵对象,它们的加减乘除运算缺省采用矩阵方式计算,因此用法和Matlab十分类似。但是由于 NumPy 中同时存在 ndarray 和 matrix 对象,因此用户很容易将两者弄混。这有违 Python 的“显式优于隐式”的原则,因此官方并不推荐在程序中使用 matrix。在这里,我们仍然用 ndarray 来介绍。矩阵和向量积矩阵的定义、矩阵的加法、矩阵的数乘、矩阵的转置与二维数组完全一致,不再进行说明,但矩阵的乘法有
2020-11-29 21:03:34
561
原创 Task03 统计相关-次序统计
统计相关次序统计计算最小值numpy.amin(a[, axis=None, out=None, keepdims=np._NoValue, initial=np._NoValue, where=np._NoValue])Return the minimum of an array or minimum along an axis.【例】计算最小值import numpy as npx = np.array([[11, 12, 13, 14, 15],[16, 17, 18, 19, 20],
2020-11-28 20:27:28
142
原创 Numpy下-随机抽样课后练习
创建一个形为5×3的二维数组,以包含5到10之间的随机数。【知识点:随机抽样】如何创建随机二维数组?生成相应的数据【知识点:随机抽样】在这里插入图片描述创建分别具有5000个数据的训练集(xi,y)和测试集(xi,y),其中xi在间隔(-10,10)上均匀随机分布。为了使回归问题“真实”,大的均匀噪声分布在[-0.2,0.2]已添加到所有训练样本中,同时测试数据保持无噪声。在这里插入图片描述...
2020-11-25 23:37:47
366
原创 Numpy下-输入输出课后练习
只打印或显示numpy数组rand_arr的小数点后3位。rand_arr = np.random.random([5, 3])【知识点:输入和输出】如何在numpy数组中只打印小数点后三位?将numpy数组a中打印的项数限制为最多6个元素。【知识点:输入和输出】如何限制numpy数组输出中打印的项目数?打印完整的numpy数组a而不中断。【知识点:输入和输出】如何打印完整的numpy数组而不中断?...
2020-11-23 22:46:15
131
原创 Task1 赛题理解
Task1 赛题理解1 Task1 赛题理解Tip:本次新人赛是Datawhale与天池联合发起的0基础入门系列赛事第四场 —— 零基础入门金融风控之贷款违约预测挑战赛。 赛题以金融风控中的个人信贷为背景,要求选手根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款,这是一个典型的分类问题。通过这道赛题来引导大家了解金融风控中的一些业务背景,解决实际问题,帮助竞赛新人进行自我练习、自我提高。项目地址:https://github.com/datawhalechina/team-l
2020-09-15 23:09:54
956
原创 Task2:数理统计与描述性分析(第二次打卡)
一、数理统计概念1.基本概念释义定义:在数理统计中,称研究对象的全体为总体,通常用一个随机变量表示总体。组成总体的每个基本单元叫个体。从总体 XXX 中随机抽取一部分个体 X1,X2,...,XnX_1,X_2,...,X_nX1,X2,...,Xn ,称 X1,X2,...,XnX_1,X_2,...,X_nX1,X2,...,Xn 为取自 XXX 的容量为 nnn 的样本。 例如,为了研究某厂生产的一批元件质量的好坏,规定使用寿命低于1千小时的为次品,则该批元件的全体就为总体,每个元
2020-06-24 23:12:11
779
原创 Pandas第六章缺失值打卡
五、问题与练习¶问题【问题一】 如何删除缺失值占比超过25%的列?【问题二】 什么是Nullable类型?请谈谈为什么要引入这个设计?【问题三】 对于一份有缺失值的数据,可以采取哪些策略或方法深化对它的了解?练习【练习一】现有一份虚拟数据集,列类型分别为string/浮点/整型,请解决如下问题:(a)请以列类型读入数据,并选出C为缺失值的行。(b)现需要将A中的部分单元转为缺失值,单元格中的最小转换概率为25%,且概率大小与所在行B列单元的值成正比。In [105]:pd.read_c
2020-06-23 23:19:13
462
原创 概率论与数理统计第一次打卡
一、随机事件1.基本概念释义现实生活中,一个动作或一件事情,在一定条件下,所得的结果不能预先完全确定,而只能确定是多种可能结果中的一种,称这种现象为随机现象。 例如,抛掷一枚硬币,其结果有可能是出现正面,也有可能是出现反面;掷骰子游戏中,出现的数字可能是1,2,3,4,5,6其中的任意一个。以上这些现象都是随机现象。使随机现象得以实现和对它观察的全过程称为随机试验,记为**EEE**。随机实验满足以下三个条件:可以在相同条件下重复进行;结果有多种可能性,并且所有可能结果事先已知;作一次试验究
2020-06-22 21:07:52
333
原创 Pandas Task6——综合练习
第六次-大作业一、2002 年-2018 年上海机动车拍照拍卖df_car = pd.read_csv(‘数据集/2002年-2018年上海机动车拍照拍卖.csv’)##1df = df_car.copy()df[‘percent’] = df.apply(lambda x:x[‘Total number of license issued’]/x[‘Total number of ap...
2020-05-01 22:53:54
314
原创 2020.04.30 Pandas合并
1.5.2 2. 练习1.5.2.1 【练习一】有2张公司的员工信息表,每个公司共有16名员工,共有五个公司,请解决如下问题:pd.read_csv(‘data/Employee1.csv’).head()Company Name Age Height Weight Salary0 A a1 47 188 63.7 258191 A a3 39 172 55.9 219832 A ...
2020-04-30 22:36:43
335
原创 2020.04.28 Pandas变形
1.4 四、问题与练习1.4.1 1. 问题1.4.1.1 【问题一】 上面提到了许多变形函数,如melt/crosstab/pivot/pivot_table/stack/unstack函数,请总结它们各自的使用特点。1.4.1.2 【问题二】 变形函数和多级索引是什么关系?哪些变形函数会使得索引维数变化?具体如何变化?1.4.1.3 【问题三】 请举出一个除了上文提过的关于哑...
2020-04-28 23:47:51
270
原创 2020.04.26 第3章 分组
1.5.2 2. 练习1.5.2.1 【练习一】: 现有一份关于diamonds的数据集,列分别记录了克拉数、颜色、开采深度、价格,请解决下列问题:pd.read_csv(‘data/Diamonds.csv’).head()carat color depth price0 0.23 E 61.5 3261 0.21 E 59.8 3262 0.23 E 56.9 3273 0....
2020-04-26 23:01:28
238
原创 Pandas——1 第2章 索引
1.7.2 2. 练习1.7.2.1 【练习一】 现有一份关于UFO的数据集,请解决下列问题:pd.read_csv(‘data/UFO.csv’).head()datetime shape duration (seconds) latitude longitude0 10/10/1949 20:30 cylinder 2700.0 29.883056 -97.9411111 10/...
2020-04-23 23:15:43
391
1
原创 1 第1章 Pandas基础
1.5.2 2. 练习1.5.2.1 【练习一】 现有一份关于美剧《权力的游戏》剧本的数据集,请解决以下问题:1.5.2.2 (a)在所有的数据中,一共出现了多少人物?df = pd.read_csv(‘data/Game_of_Thrones_Script.csv’)df.head()df[‘Name’].nunique()1.5.2.3 (b)以单元格计数(即简单把一个单元...
2020-04-20 11:51:43
593
原创 2020-03-24打卡——Task2:数据的探索性分析(EDA)
2020-03-24打卡——Task2:数据的探索性分析(EDA)用pandas_profiling生成数据报告:用pandas_profiling生成一个较为全面的可视化和数据报告(较为简单、方便) 最终打开html文件即可:import pandas_profilingpfr = pandas_profiling.ProfileReport(Train_data)pfr.to_file...
2020-03-24 20:40:26
323
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人