- 博客(6)
- 收藏
- 关注
原创 KDD(数据挖掘)概念
数据挖掘把大型数据集转换成知识。例如:Google的Flu Trends 使用特殊的收索项作为流感活动的指示器。它发现了搜索流感相关信息的人数与实际具有流感症状的人数之间的紧密联系。当与流感相关的所有搜索都聚集在一起时,一个模式就出现了。使用聚集的搜索数据,Google的Flu Trends可以比传统的系统早两周对流感活动做出评估。 OLTP的有效方法将查询看做只读事务,对于关系技术的发展以
2016-10-08 15:58:05
4638
原创 java的二次学习
这周重新学习Java,了解了dos命令行的功能,了解命令行可以操作window图形化界面的一切功能,例如进入退出磁盘文件夹cd ,cd..,建立文件del和文件夹md。下载jdk后,打开记事本,运用dos命令行同样可以调用javac.exe对记事本里内容进行编译,调用java.exe进行运行,十分神奇。 当然,还有许多细节问题与技巧,比如命令行设置环境变量path,设置classpath等等,这就
2016-10-06 12:41:39
221
原创 实验报告:CURE聚类预测
这周工作室考核,实现cure聚类预测。 CURE算法: 纯属个人理解: 1.将数据划分k个区。 2.每个区分别聚类,成为k个簇. 3.选择每个簇的分布较好的点作为簇的代表点,排除异常点及聚类缓慢的点。 4.利用每个簇分别聚类落在每个新形成得簇中的代表点向簇中心收缩。 5.以代表点计算簇间距离,将每个簇之间的距离排序,将最近的簇进行聚合。 library(fpc) x1 =
2016-09-29 12:26:10
936
原创 c++的一周日记
虽然c++尚未讲完,但由于上学期报了二级考试,我只能抓紧在这一周自己预习c++未学部分。 学了OOP中的Class。常成员用const约束。常数据成员是指数据成员在实例化被初始化后约束为只读;常成员函数是指成员函数的this指针被约束为指向常量的常指针,在函数体内不能修改数据成员的值。 静态成员的作用域局部于Class,它提供了一种同类对象的共享机制。 友元可以访问类的所有成员,包括私有成员。
2016-09-21 11:06:00
284
原创 kettle学习日记(2)
定义变量: 有几种方法可以动态设置变量,最简单的方式是使用转换里的“Set Variables”步骤,也可以在一个作业中先设置几个变量,然后在后面的步骤中使用这些变量。 使用变量时,变量要使用${}符号引用。kettle被归类为可视化编程语言,因为kettle可以使用图形化得方式定义复杂的ETL程序和工作流。kettle里的图就是转换和作业。 在画布左侧输入”类别”中单击“CSV文件输入”步骤
2016-09-14 13:37:14
250
原创 kettle学习日记(1)
OLTP和BI数据库的最大区别是在一个单一事务里要分析的数据的数据的数量。 数据整合方式主要有三种:ETL,ELT,ELL。ETL定义为从OLTP等转移到数据仓库等中的一系列操作的集合。ELT将所有大数据量处理全部放在目标数据库中进行,更适合处理负荷在百万级以上的数据集成。ELL是一种虚拟数据集成方式。 了解了kettle的设计原则,kettle的设计模块等初步概念。 本周主要根据老师
2016-09-04 20:16:16
342
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅