- 博客(12)
- 资源 (3)
- 收藏
- 关注
原创 基于最大熵模型的文本分类探讨
最大熵模型是近年来自然语言处理领域最成功的机器学习方法之一。本文首先介绍最大熵模型,然后探讨其在文本分类中的应用可行性。
2015-01-07 15:34:24
922
原创 weka开发简介
WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),同时weka也是新西兰的一种鸟名,而WEKA的主要开发者来自新西兰。WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。本文首先在eclipse调用weka的算法,再向weka系统导入新算法,通过这两方面的应用对weka进行熟悉。
2015-01-07 15:25:03
502
原创 Twin Support Vector Machines(孪生支持向量机)
支持向量机在机器学习和数据挖掘领域应用广泛,因此在传统的支持向量机的基础上引申出了大量变形的支持向量机。其中2007年由Jayadeva提出的孪生支持向量机在性能和速度上表现卓越,本文先通过简单的讲解支持向量机,进一步引出广义特征值支持向量机,最后引出孪生支持向量机,并将孪生支持向量机与传统支持向量机进行对比。
2015-01-07 15:11:02
8294
原创 Association Rules--FP-growth Algorithm
1.与Apriori相比在挖掘关联规则的过程中,无可避免要处理海量的数据,也就是事务数据库如此之大,如果采用Apriori算法来挖掘,每次生成频繁k-项集的时候,可能都需要扫描事务数据库一遍,这是非常耗时的操作。那么,可以想尽办法来减少扫描事务数据库的次数,来改进挖掘频繁关联规则的效率。 FP-tree是频繁模式树,它是将整个事务数据库压缩到一棵频繁模式树上。而且,在构造整个事务数据库
2014-11-02 16:00:33
567
翻译 The loss of the Titanlic--new concept english
The great ship, sailed for New York from Southampton on April 10th, 1912. She was carrying 1,316 passengers and a crew of 891. Even by modern standards, the 46,000 ton Titanic was a colossal ship. At
2014-03-08 10:50:56
734
原创 论我的个人修养
成为一个当的了leader,打的入小团体,当的了好老公的新时代programer一、首先,要想当leader,就必须要培养自己的领导能力1)有魅力,说话必须要有领导范儿,该强硬的时候要强硬,该果断时要果断,必须让人信服,所以要多看书;2)有才华,要懂得尽量广泛的知识,而且要比普通人做更多的知识准备,做到稳健有条例,要投入;3)有魄力,能随机应变,有足够的定力,遇事要淡定,让人觉得有
2014-02-15 20:24:50
692
原创 学习进度之--隐私保护具体介绍
一、学习目的弄清数据共享中的隐私保护现有的技术,并整合到实际项目中。二、学习进度1.2013年9月-2013年12月,和本科生一起查阅资料,并每周举行例会讨论学习进度,并做会议记录。2.2014年1月-2014年2月,由于进度太慢,导师要求在寒假期间写出一篇关于隐私保护的文章(先写文献综述),并能发表于B1级别的期刊上。三、学习中遇到的难点总结1.多重角
2014-02-12 17:50:25
626
原创 Java Web开发之Struts2与Spring、Hibernate三者整合
<br />Struts2与Spring、Hibernate三者整合的过程示例:<br />示例工具:MyEclipse 7.0、Tomcat 6.0、MySql<br />步骤:<br />1.创建一个WEB工程,命名为BookShop(名字自己取,此处为示例工程名);<br />2.导入struts2的核心jar包,也就是在WEB-INF下的lib文件夹中放入jar包文件,如下图(图中jar包为示例版本):<br /><br />3.加载spring,选中工程名,右击并选择【MyEclipse】选项下的
2011-04-24 09:26:00
540
Struts权威指导
2011-04-24
Struts2权威指南(完整版)
2011-04-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人