7月20日下一步工作

本文探讨了数据导入处理、层次聚类及k-means算法的理解应用,涉及降维方法如tf-idf等,同时深入研究了LDA主题模型,并讨论了本体距离计算公式。

1、6类数据的导入和处理

2、层次聚类和kmeans 的具体理解,包括

    (1)如何降维,仅仅靠tf-idf吗,除此以外还有没有别的方法?

    (2)对层次聚类中每种参数和变量的设置,探讨其对结果的影响,选出最优的参数设置,并写成报告;对其绘图的思考。

    (3)对kmeans方法的参数和变量的设置,如何将相关的term画到一起。

3、LDA方法的研究。

4、本体距离的计算公式。

4、最终报告的撰写。

转载于:https://www.cnblogs.com/todoit/archive/2012/07/20/2601025.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值