数据挖掘
LYX0721
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
用GAIN来补充缺失数据之论文篇(一)
原文章如下图是算法的图示:在这个算法中,我们定义如下几个变量:通过原始数据保留未缺失的数据得到: X~={Xiif Mi =1∗otherwise\ \tilde X = \begin{cases}X_i&\text{if $M_i$ =1}\\*&\text otherwise\end{cases} X~={Xi∗if Mi =1otherwise接下来通过训练生成器通过随机变量Z来填补:Xˉ=G(X原创 2020-07-22 23:11:14 · 4427 阅读 · 2 评论 -
用GAIN来补充缺失数据之代码篇(一)
原论文原代码在这篇博客中,我们解析用生成对抗系统如何有效补充缺失数据的一种方法。def gain (data_x, gain_parameters): # Define mask matrix data_m = 1-np.isnan(data_x) #mask matrix # system parameters batch_size = gain_parameters['batch_size'] hint_rate = gain_parameters['hint_rate']原创 2020-07-22 09:38:19 · 3298 阅读 · 1 评论 -
怎样处理缺失数据(二)处理缺失数据基本方法分类
处理缺失数据的方法可分为以下几类:1. 只保留观察数据 (Procedures based on completely recorded units)这种方法去除所有在某一变量上有缺失数据的纪录,只保留所有数据完整的纪录。优点:容易实施缺点:只适用于缺失数据较少的数据,可能产生较大误差。2. 加权 (Weighting procedures)这种方法也是通过对现有未缺失数据通过以下公式进行加权处理 yˉHK=∑i=1n(πip^i)−1yi∑i=1n(πip^i)−1\ \bar原创 2020-07-18 14:30:29 · 3337 阅读 · 0 评论 -
怎样处理缺失数据(一):判断缺失的模式和机制
怎样处理缺失数据?一、缺失数据的定义我们首先来看一下缺失数据的定义:Missing data are unobserved values that would be meaningful foranalysis if observed; in other words, a missing value hides ameaningfulvalue.缺失数据是指一些观测后对分析有意义的未观测数据。例如,当我们在事先调查选举情况时,有三种答案,yes,no和missing。如果这个missing原创 2020-07-17 16:09:37 · 6336 阅读 · 1 评论
分享