#数据转换

我的想法:

数据处理

- 光滑数据:采用滑动平均的方法,设置window_size,进行光滑
- 规范化:两种方法,归一化、标准化

- 补充:如果数据不是数值类型的,先进行属性映射,再序列标准化
Z = m i − 1 M a x ( m ) − 1 Z = \frac{m_i -1}{Max(m) -1} Z=Max(m)−1mi−1
哈尔小波分解

步骤:
- 按粒度求window均值(粒度就是window_size,不重叠的)
- 求window的最大的数和均值的差
- 重复1、2把序列遍历完
- 合并均值和求完差值的结果,长度应该和原序列等长
- 重复以上4步,直到达到设定的轮数,分解的越来越小

距离计算

三种距离描述:


Aprior
{1,3,6,8,9}可能的子项集,及频繁子项集

FP-Growth
T1


T2

个人题解:


关于频繁项集的概念

关联规则



- 写的不对,emmm
判断是否频繁的依据是:
X是否为任一闭频繁项的子集,如果是则频繁,支持度为所属闭频繁项集(集合C中,X可能是多个闭频繁项集的子集)中,支持度计数最大的闭频繁项集的支持度。
- 所以第二问:应该是X所属闭频繁项集中,支持度计数最大的
SVM




灰色预测模型:
灰色模型(Grey Model,简称GM模型)一般表达方式为GM(n,x)模型,其含义是:用n阶微分方程对x个变量建立模型。
通过把分散在时间轴上的离散数据看成一组连续变化的序列,采用累加和累减的方式,将灰色系统中的未知因素弱化,强化已知因素的影响程度,最后构建一个以时间为变量的连续微分方程,通过数学方法确定方程中的参数,从而实现预测目的。

907

被折叠的 条评论
为什么被折叠?



