BTM 模型的变种,思路是解决BTM的两个基本问题:1,话题个数不确定,需要手动设置;2,没有区分biterm的类型,即general和topical话题。采用的方法有为:对于问题1,利用中国餐馆问题,crp,动态的生成话题(类似HDP?);对于问题2,通过PMI,单词对互信息量评价单词的相关性,其假设为topical单词的互信息量更高。
——借鉴意义:话题确实需要细化,个数?类型?
——提到twitter-BTM,也即按照用户对twitter数据集进行分析(作为语料库运行BTM模型)
BTM 模型的变种,思路是解决BTM的两个基本问题:1,话题个数不确定,需要手动设置;2,没有区分biterm的类型,即general和topical话题。采用的方法有为:对于问题1,利用中国餐馆问题,crp,动态的生成话题(类似HDP?);对于问题2,通过PMI,单词对互信息量评价单词的相关性,其假设为topical单词的互信息量更高。
——借鉴意义:话题确实需要细化,个数?类型?
——提到twitter-BTM,也即按照用户对twitter数据集进行分析(作为语料库运行BTM模型)