
数据挖掘
QWsin
这个作者很懒,什么都没留下…
展开
-
weka基础操作
序在数据挖掘课程中,使用到了数据挖掘软件weka,因为不太熟悉,目前也没有找到文档,遇到问题的时候,就直接去读源码,像挖宝藏一样,不知道什么时候能解决问题,是一个很有趣的过程。也做一个记录,方便自己和大家查阅。判断属性为标称型还是数值型在weka的Attribute类中,对于每个属性的类型用一个int存放,分为以下几种类型:NUMERIC = 0;//连续型(数值型)NOMINAL = 1;//离散型(标称型)STRING = 2;//一个任意长的字符序列,包含在双引号内DATE = 3;//原创 2021-04-19 17:50:55 · 508 阅读 · 0 评论 -
FP树为什么要对每个项单独进行构造再递归的操作
最近在学FP树,学了之后就有一个疑惑,发现以下几个性质一个点的父亲肯定计数不小于他的儿子然后就错误的感觉最后的结果是包含根的一颗树,并且所有的顶点的计数都≥\ge≥最小支持度计数,那么也就只需要不断地往上删掉叶子,并且同时清除叶子对祖先的贡献(到一个叶子必定会经过祖先,贡献就是叶子的计数),最后就可以得到答案,复杂度是O(节点数)O(节点数)O(节点数)的。开始还以为自己十分正确,为什么...原创 2020-04-10 11:01:32 · 237 阅读 · 1 评论