
机器学习
文章平均质量分 88
mpk_no1
这个作者很懒,什么都没留下…
展开
-
层次聚类实例以及Java实现
本文主要讲述一个层次聚类实例,使用层次聚类算法将相似图书的目录进行聚类。由于不知道要聚为多少类,所以Kmeans聚类算法不适用,而层次聚类由于不需要设置聚类中心数,只要传递一个阈值即可,所以正好适合于这个问题。本文将结合层次聚算法的原理以及其Java代码实现来展现文本聚类的一个实现方式。具体代码见我的GitHub(点击打开链接)原创 2017-05-22 12:16:11 · 6860 阅读 · 2 评论 -
深度学习笔记——基于传统机器学习算法(LR、SVM、GBDT、RandomForest)的句子对匹配方法
句子对匹配(Sentence Pair Matching)问题是NLP中非常常见的一类问题,所谓“句子对匹配”,就是说给定两个句子S1和S2,任务目标是判断这两个句子是否具备某种类型的关系。本文用机器学习算法实现了一种有监督的句子对匹配方法,使用的机器学习分类算法有:逻辑回归(LR)、SVM、GBDT和随机森林(RandomForest),使用的工具是Sklearn。并在Quora公开的一个数据集上做了一些对比试验。原创 2017-06-01 22:41:38 · 8668 阅读 · 0 评论 -
频繁项挖掘-Apriori算法
频繁项挖掘-Apriori算法原创 2017-07-24 22:50:38 · 1591 阅读 · 1 评论 -
自动编码器AutoEncoder学习总结
自编码器AutoEncoder学习总结,整理AutoEncoder的原理,AutoEncoder在分类任务上的使用,稀疏AE,以及对AE改进得到文档或句子向量表达的一篇paper(KATE: K-Competitive Autoencoder for Text)(KDD2017)原创 2017-07-23 21:01:16 · 15538 阅读 · 1 评论