数据处理
文章平均质量分 50
Y_hero
不破不立,破而后立
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
ADF 单位根检验 Dickey-Fuller 迪基-福勒检验
名词解释:Dickey-Fuller 迪基-福勒检验, 单位根检验, 如果存在时序数据中存在单位根, 则表明是非平稳序列ADF检验 增广迪基-福勒检验 排除了自相关的影响为什么需要检验:单位根检验师时序序列分析的一个热点问题, 大部分时序模型都要求输入数据具有稳定性, 因此要先检测数据是否稳定.如果数据本身是不稳定的, 要对数据做差分变化等操作消除单位根, 此时目标值已经没有了实际含义, 但是满足模型需求, 结果在逆向推导.检验原理:时序回归方程: x_t = k *(x_t -1)原创 2021-02-04 12:27:53 · 7960 阅读 · 0 评论 -
Tsfresh 时序数据特征挖掘 特征算子简介
本篇介绍现有主要算子含义和使用注意是想基础算子简单复合算子一.本身无时序概念算子二.本身有时序概念算子复杂复合算子一些使用感悟和补充懂的都懂,下文算子基本按照源码顺序罗列.如果有其他关于tsfresh的问题,欢迎留言讨论,后续可能会再写tsfresh的其他系列文章.部分算子示例:github_jupyter_notenook基础算子1.sum_values(x)2.median(x)3.mean(x)4.length(x)5.standard_deviation(x) 标准差6.vari原创 2020-11-28 21:56:00 · 2049 阅读 · 0 评论 -
PCA降维原理及sklearn代码实现
PCA(Principal Component Analysis)是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。本文从实际问题代入探索PCA,尽量避免纯数学的推导,更简单明了地讲解PCA原理。1.数据的向量表示及降维问题的产生一般情况下,在数据挖掘和机器学习中,数据被表示为向量来进行处理,就拿我近期做的...原创 2019-03-08 11:42:55 · 5862 阅读 · 1 评论 -
pandas.get_dummies 的使用及含义
get_dummies 是利用pandas实现one hot encode的方式。get_dummies参数如下:pandas.get_dummies(data,prefix = None,prefix_sep =’_’,dummy_na = False,columns = None,sparse = False,drop_first = False,dtype = None )data :...原创 2019-03-08 21:40:17 · 11700 阅读 · 0 评论
分享