
机器学习
傻瓜菜的傻瓜菜地
傻瓜菜。。。
展开
-
2017.05.23:SVM、TFIDF、word2vect
原创 2017-05-23 10:18:33 · 572 阅读 · 0 评论 -
2017.05.31:Mysql+Python 余弦相似度
1.mysql字段类型2.余弦相似度原创 2017-05-31 09:27:48 · 701 阅读 · 0 评论 -
2017.06.22: note for LDA
原创 2017-06-22 10:58:56 · 262 阅读 · 0 评论 -
2017.06.22:LDA与困惑度代码
LDA代码:class LDAModel(object): def __init__(self, dpre): self.dpre = dpre # 获取预处理参数 # # 模型参数 # 聚类个数K,迭代次数iter_times,每个类特征词个数top_words_num,超参数α(alpha) β(beta) # self.K = K self.beta转载 2017-06-22 11:12:28 · 4828 阅读 · 9 评论 -
2017.07.13:无监督算法评估
无监督学习的评估方法1.Normalizedmutual information度量2个聚类结果的相近程度http://www.cnblogs.com/ziqiao/archive/2011/12/13/2286273.html2.以sqrt(n)或者更小的随机subsampling出的样本去聚类 m次,看看有哪些点分类不太一致改变聚类参数,达到比较结果3.把无监督学习的结原创 2017-07-13 10:57:21 · 905 阅读 · 0 评论