http://blog.youkuaiyun.com/puqutogether/article/details/43309717
http://blog.youkuaiyun.com/u010159842/article/details/48637095
MATLAB
● 主函数与子函数:注意不能在命令提示行中定义子函数,即不能在同一个.m文件“function” 。说白了就是主函数与子函数分别置于不同.m文件,并将子函数命名为相应的名字,放到同一个路径下,用就行。
● 数值输出格式:预设—命令行窗口—可设置数值精度、loose/compact即有无空行。
参考了本文开头网址内的pLSA代码,下两图为使用原文数据的运行结果:
只取一类(如汽车类) 5行10列矩阵,成功运行:
取两类(如汽车类/银行类) 10行20列矩阵,运行全NAN:
构造出的矩阵存在的问题:数据稀疏,非零条目——结果几乎全为NAN
是行/列为0的问题(即文本和词条应当足够大,使得每个文本都有相应的”词“,每个词都有相应的”文本“)