
数据挖掘
羊老羊
海的尽头是另一片海
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数据挖掘:Joyful Pandas:02 pandas基础
第20期Pandas组队学习文章目录第20期Pandas组队学习2.0 内容串联2.1 文件的读取和写入2.1.1 文件的读取2,1,2 数据的写入2.2 基本数据结构2.2.1 Series2.2.2 DataFrame2.3 常用基本函数2.3.1 汇总函数2.3.2 特征统计函数2.3.3 唯一值函数2.3.4 替换函数2.3.5 排序函数2.3.6 apply方法2.4 窗口对象2.4.1 滑窗对象2.4.2 扩张窗口2.5 练习2.5.1 Ex1: 口袋妖怪数据集2.5.2 Ex2: 指数加权窗原创 2020-12-19 21:05:36 · 269 阅读 · 1 评论 -
数据挖掘:Joyful Pandas:01 预备知识
第20期Pandas组队学习文章目录第20期Pandas组队学习1. 预备知识1.1 Python 基础1.1.1 列表推导式的与条件赋值(1)一层嵌套实例(2)多层嵌套实例(3)条件赋值实例1.1.2 匿名函数与map()方法(1)匿名函数:lambda(2)map1.1.3 zip对象与enumerate方法1.2 Numpy 基础1.2.1 np 数组的构造1.2.2 np 数组的变形与合并1.2.3 np 数组的切片与索引1.2.4 常用函数1.2.5 广播机制1.2.6 向量与矩阵的计算1.3原创 2020-12-16 21:06:01 · 267 阅读 · 0 评论 -
task03:Numpy基础学习_数组操作、向量化和广播
1.数组操作1.1更改形状在对数组进行操作时,为了满足格式和计算的要求通常会改变其形状。numpy.ndarray.shape 表示数组的维度,返回一个元组,这个元组的长度就是维度的数目,即 ndim 属性(秩)。例如:通过修改 shap 属性来改变数组的形状import numpy as npx = np.array([1, 2, 9, 4, 5, 6, 7, 8])print(x.shape) # (8,)x.shape = [2, 4]print(x)# [[1 2 9原创 2020-10-25 20:58:47 · 172 阅读 · 0 评论 -
task02:索引
import numpy as npx = np.array([1,2,3,4,5,6,7,8])y = xy[0] = -1print(x)print(y)[-1 2 3 4 5 6 7 8][-1 2 3 4 5 6 7 8]x = np.array([1,2,3,4,5,6,7,8])y = x.copy()y[0] = -1print(x)print(y)[1 2 3 4 5 6 7 8][-1 2 3 4 5 ...原创 2020-10-23 22:52:17 · 160 阅读 · 1 评论 -
DW十月学习:Numpy入门(一)
1. 常量1.1 numpy.nan① 表示空值nan = NaN = NAN ② 两个nan不相等import numpy as np print(np.nan == np.nan) print(np.nan != np.nan) FalseTrue③import numpy as npx = np.array([1, 1, 8, np.nan, 10])print(x)y = np.isnan(x) # x数组里有数据分别是不是nanprint(y)z =原创 2020-10-20 21:05:20 · 483 阅读 · 1 评论 -
金融风控-贷款违约预测
1.EDA价值主要在于熟悉了解整个数据集的基本情况(缺失值,异常值),对数据集进行验证是否可以进行接下来的机器学习或者深度学习建模.2.了解变量间的相互关系、变量与预测值之间的存在关系。3.为特征工程做准备import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport datetime%matplotlib inlinepd.set_option(‘display原创 2020-09-18 22:00:50 · 283 阅读 · 0 评论 -
金融风控-贷款违约预测Task1
一.容易混淆若一个实例为正类,被预测为负类,即为假负类。(False Negative)(FN)若一个实例为负类,被预测为正类,即为假正类。(False Positive)(FP)二.概念理解:1.精确率(Precision):P = TP/(TP + FP)表述了分为正类的示例中实际为正类的比例。2. 召回率(Recall):recall=TP/(TP+FN)是覆盖面的度量,度量有多少个正类被分为正类。与此对等有灵敏度(sensitive):sensitive = TP/P,表示的是所有原创 2020-09-15 22:57:24 · 348 阅读 · 0 评论