
计算机顶会及顶刊
文章平均质量分 94
HFUT_qianyang
刘老师指示:学如逆水行舟,不进则退;心似平原跑马,易放难收。不能放松,继续!
展开
-
利用LDA主题模型的生成过程仿真数据
仿真代码因为,最近论文,需要基于图模型的过程,仿真数据。因此,找了一些已有的代码和论文。以下,是利用LDA的生成过程仿真数据的过程,这个代码是使用R语言编写的,代码来源于:https://www.r-bloggers.com/topic-modeling-1-simulated-lda-corpus/(https://gist.github.com/robbymeals/3985469)。### Basic LDA Topic Model Simulation ###### Generate Simu原创 2020-07-03 10:16:38 · 1389 阅读 · 0 评论 -
面向消费者的自动文本分析(Automated Text Analysis for Consumer Research) 2017 JCR 论文阅读
文章简介Humphreys A, Jen-Hui Wang R. Automated Text Analysis for Consumer Research[J]. Journal of Consumer Research, 2017. 来自于管理类顶刊 Journal of Consumer Research,2017年发表的。概述性文章,讲述文本分析的流程,需要注意的问题,以及在消费者研...原创 2018-06-14 15:15:02 · 1679 阅读 · 0 评论 -
2018 A Sparse Topic Model for Extracting Aspect-Specific Summaries from Online Reviews 稀疏主题模型学习笔记
论文来源文章介绍模型及推理关于源码论文来源Rakesh V, Ding W, Ahuja A, et al. A Sparse Topic Model for Extracting Aspect-Specific Summaries from Online Reviews[C]//Proceedings of the 2018 World Wide Web Confere...原创 2018-07-09 17:22:56 · 1149 阅读 · 0 评论 -
识别和追踪主题层次的影响力者(来自2018 Machine Learning 论文学习笔记)
本文作者:合肥工业大学 管理学院 钱洋 email:1563178220@qq.com 。以下内容是个人的论文阅读笔记,内容可能有不到之处,欢迎交流。未经本人允许禁止转载。文章目录论文来源论文学习笔记论文来源来自于2018年Machine Learning期刊上的论文。Su S, Wang Y, Zhang Z, et al. Identifying and tracking topic...原创 2018-11-05 15:33:00 · 1406 阅读 · 0 评论 -
变分推断之高斯混合模型(案例及代码)
本文作者:合肥工业大学 管理学院 钱洋 email:1563178220@qq.com 内容可能有不到之处,欢迎交流。未经本人允许禁止转载。案例来源本博客讲解的案例来源于于Journal of the American Statistical Association期刊(顶刊)上的内容:Blei D M, Kucukelbir A, McAuliffe J D. Variational i...原创 2019-01-29 19:15:47 · 16842 阅读 · 9 评论 -
Collapsed Variational Inference(Collapsed变分推断)算法以LDA推导为例
简介Collapsed Variational Inference(CVI)来源于下面这篇文章:Teh Y W, Newman D, Welling M. A collapsed variational Bayesian inference algorithm for latent Dirichlet allocation[C]//Advances in neural information ...原创 2019-02-16 11:14:53 · 1974 阅读 · 1 评论 -
Incorporating Lexical Priors into Topic Models(即交互式主题模型的应用)论文阅读
论文来源论文来自于自然语言处理会议ACLJagarlamudi J, Daumé III H, Udupa R. Incorporating lexical priors into topic models[C]//Proceedings of the 13th Conference of the European Chapter of the Association for Computat...原创 2019-03-30 11:19:08 · 688 阅读 · 0 评论 -
Java实现多元t分布函数(Multivariate t distributions)
本文作者:合肥工业大学 管理学院 钱洋 email:1563178220@qq.com 内容可能有不到之处,欢迎交流。未经本人允许禁止转载文章目录问题背景编程实现问题背景最近,在独立实现Gaussian LDA算法时,遇到了Multivariate t distributions。Gaussian LDA对应的论文是:Das R, Zaheer M, Dyer C. Gaussian l...原创 2019-06-05 17:34:38 · 3967 阅读 · 0 评论 -
Collaborative topic modeling(推荐)算法实现中的大数组问题
问题背景最近,在使用Java实现一个个性化推荐算法时,遇到了非常常见的问题。实现的算法为:Wang C, Blei D M. Collaborative topic modeling for recommending scientific articles[C]//Proceedings of the 17th ACM SIGKDD international conference on Kn...原创 2019-05-31 17:39:53 · 1115 阅读 · 0 评论 -
Labeled LDA(有监督)主题模型的理解、推理与编程
本文作者:合肥工业大学 管理学院 钱洋 email:1563178220@qq.com 。以下内容是个人的论文阅读笔记,内容可能有不到之处,欢迎交流。未经本人允许禁止转载。文章目录算法来源算法简介背景Labeled LDA模型参数学习编程实现算法来源这个算法来源于:Ramage D, Hall D, Nallapati R, et al. Labeled LDA: A supervis...原创 2019-06-04 16:15:33 · 11148 阅读 · 3 评论 -
变分推断中的ELBO(证据下界)
变分推断简介变分推理的目标是近似潜在变量(latent variables)在观测变量(observed variables)下的条件概率。解决该问题,需要使用优化方法。在变分推断中,需要使用到的一个重要理论,是平均场理论,读者可以参考我的另外一篇博客:https://qianyang-hfut.blog.youkuaiyun.com/article/details/86644192变分推断等价于最小化...原创 2019-06-20 20:36:21 · 54800 阅读 · 6 评论 -
HDP(层次狄利克雷过程)算法代码实现细节梳理(Java)
本文作者:合肥工业大学 电子商务研究所 钱洋 email:1563178220@qq.com 。内容可能有不到之处,欢迎交流。未经本人允许禁止转载。文章目录HDP简介有向图表示CRF的关键HDP的采样编程角度解读采样桌子采样主题完整代码参考HDP简介Teh Y W, Jordan M I, Beal M J, et al. Sharing clusters among related g...原创 2019-06-23 10:42:09 · 8232 阅读 · 3 评论 -
Partially Labeled Dirichlet Allocation(PLDA)算法的理解与编程细节(Java)
本文作者:合肥工业大学 电子商务研究所 钱洋 email:1563178220@qq.com 。内容可能有不到之处,欢迎交流。未经本人允许禁止转载。文章目录论文来源模型论文来源Ramage D, Manning C D, Dumais S. Partially labeled topic models for interpretable text mining[C]//Proceedin...原创 2019-06-24 22:32:47 · 1446 阅读 · 1 评论 -
双稀疏主题模型(Dual-Sparse Topic Model)编程实现中的细节 Java
本文作者:合肥工业大学 电子商务研究所 钱洋 email:1563178220@qq.com 。内容可能有不到之处,欢迎交流。未经本人允许禁止转载。文章目录论文来源相关介绍单稀疏模型双稀疏模型模型推理Java编程实现的细节论文来源Lin T, Tian W, Mei Q, et al. The dual-sparse topic model: mining focused topics ...原创 2019-07-04 10:17:19 · 1602 阅读 · 0 评论 -
LSTM模型结合LDA对序列性文本建模 阅读笔记 2017 ICML
本文作者:合肥工业大学 管理学院 钱洋 email:1563178220@qq.com 内容可能有不到之处,欢迎交流。未经本人允许禁止转载。文章来源 Zaheer M, Ahmed A, Smola A J. Latent LSTM Allocation: Joint Clustering and Non-Linear Dynamic Modeling of Sequence Dat...原创 2018-06-04 10:40:26 · 3852 阅读 · 0 评论 -
主题模型聚类匹配2018TKDE阅读笔记(Topic Models for Unsupervised Cluster Matching)
论文来源 Iwata T, Hirao T, Ueda N. Topic Models for Unsupervised Cluster Matching[J]. IEEE Transactions on Knowledge and Data Engineering, 2018, 30(4): 786-795.作者是日本人Iwata T,也是个机器学习大牛,每年都有一系列的文章出来,还是很厉害的。原创 2018-04-21 17:16:37 · 2173 阅读 · 1 评论 -
三层Dirichlet 过程(非参贝叶斯模型)-来自Machine Learning
文章来源Nguyen V A, Boyd-Graber J, Resnik P, et al. Modeling topic control to detect influence in conversations using nonparametric topic models[J]. Machine Learning, 2014, 95(3): 381-421. 来自于机器学习顶级期刊《Mac原创 2018-04-17 09:48:29 · 2649 阅读 · 0 评论 -
sparseTM的公式理解
本篇的论文来自:Wang C, Blei D M. Decoupling sparsity and smoothness in the discrete hierarchical dirichlet process[C]//Advances in neural information processing systems. 2009: 1982-1989.本博客作者:合肥工业大学 管理学院 钱洋 e原创 2017-05-08 22:20:31 · 883 阅读 · 2 评论 -
Indian Buffet Process(印度自助餐过程)介绍
简介无监督学习的目的是从观测数据中,发掘潜在的结构(latent structure)。无监督学习算法的一个关键问题是如何确定潜在结构的数目,如聚类中的类的数目,变量的数目等。以聚类为例,如果能够基于数据之间的内在关系,自动学习类的数目,要比通过经验设置一个数目要好的多。相比参数化的贝叶斯模型,非参贝叶斯有其独特的地方,也是近些年来,机器学习比较火的一种方法,如DPMM(Dirichlet proc原创 2017-11-14 17:30:43 · 7223 阅读 · 0 评论 -
对比关系生成模型(Comparative Relation Generative Model)
文章来源Tkachenko M, Lauw H W. Comparative Relation Generative Model[J]. IEEE Transactions on Knowledge and Data Engineering, 2017, 29(4): 771-783. 2017年TKDE上的文章,以下仅是个人理解,仅供参考,详细内容请学习原文。个人想法从评论中找原创 2018-01-26 16:50:30 · 999 阅读 · 0 评论 -
基于多源文档片段的神经网络排序模型(Neural Ranking Models with Multiple Document Fields)
文章来源Zamani, Hamed, Neural Ranking Models with Multiple Document Fields.18年Web Search and Data Mining(WSDM)会议上的一篇文章,主要是使用神经网络对文本进行处理,将其应用到搜索引擎检索任务之中。以下,是个人看文章的笔记,由于对神经网络还不是很了解,如有问题,还望见谅。文章内容原创 2018-01-30 16:31:56 · 651 阅读 · 0 评论 -
Targeted Topic Modeling for Focused Analysis(TTM的理解)
问题描述问题定义最简单的实现方法作者提出的模型代码本文作者:合肥工业大学 管理学院 钱洋 email:1563178220@qq.com 内容可能有不到之处,欢迎交流。 未经本人,允许禁止转载。本文给原文作者发了几封邮件,询问一些程序及推理方面的疑问,原文作者都悉心回答了,再次表示衷心感谢。问题描述这篇文章发表在16年ACM会议上,主要是对主题模型的改进。从文章的题目可以看出,该模型可原创 2017-04-19 21:48:23 · 1737 阅读 · 0 评论 -
Dirichlet Multinomial Mixture Model做短文本聚类
论文来源Yin J, Wang J. A dirichlet multinomial mixture model-based approach for short text clustering[C]//Proceedings of the 20th ACM SIGKDD international conference on Knowledge discovery and data mining.原创 2018-03-03 11:31:16 · 3972 阅读 · 2 评论 -
主题模型结合词向量模型(Improving Topic Models with Latent Feature Word Representations)
本文作者:合肥工业大学 管理学院 钱洋 email:1563178220@qq.com 内容可能有不到之处,欢迎交流。 未经本人允许禁止转载。论文来源Nguyen D Q, Billingsley R, Du L, et al. Improving topic models with latent feature word representations[J]. Transactions of原创 2018-03-07 20:17:50 · 4156 阅读 · 1 评论 -
Sentence-LDA的介绍及程序
Sentence-LDA的相关论文:Jo Y, Oh A H. Aspect and sentiment unification model for online review analysis[C]//Proceedings of the fourth ACM international conference on Web search and data mining. ACM, 2011: 81原创 2017-08-16 20:36:40 · 4921 阅读 · 1 评论 -
Gaussian LDA(高斯LDA)简介
论文来源Das R, Zaheer M, Dyer C. Gaussian lda for topic models with word embeddings[C]//Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joi原创 2018-03-12 16:21:12 · 3688 阅读 · 0 评论 -
基于狄利克雷-多项式分布做文档聚类代码(dirichlet multinomial mixture model)
论文来源Yin J, Wang J. A dirichlet multinomial mixture model-based approach for short text clustering[C]//Proceedings of the 20th ACM SIGKDD international conference on Knowledge discovery and data mining.原创 2018-03-05 19:35:04 · 4013 阅读 · 0 评论 -
Dirichlet Process和Hierarchical Dirichlet Process的理解(PPT)
本文作者:合肥工业大学 管理学院 钱洋 email:1563178220@qq.com 内容可能有不到之处,欢迎交流。 未经本人允许禁止转载。原创 2018-03-23 09:59:48 · 4883 阅读 · 1 评论 -
Pseudo-document-based Topic Model(基于伪文档的主题模型)的理解以及源码解读
论文来源Zuo Y, Wu J, Zhang H, et al. Topic modeling of short texts: A pseudo-document view[C]//Proceedings of the 22nd ACM SIGKDD international conference on knowledge discovery and data mining. ACM, 2016:原创 2018-04-10 10:49:38 · 1760 阅读 · 1 评论 -
LFDMM源码剖析(融入词向量的概率图模型)
本文作者:合肥工业大学 管理学院 钱洋 email:1563178220@qq.com 内容可能有不到之处,欢迎交流。 未经本人允许禁止转载。论文来源Nguyen D Q, Billingsley R, Du L, et al. Improving topic models with latent feature word representations[J]. Transacti...原创 2018-03-24 10:40:58 · 1731 阅读 · 1 评论 -
Gamma函数(伽玛函数)的一阶导数、二阶导数公式推导及java程序
本文作者:合肥工业大学 管理学院 钱洋 email:1563178220@qq.com 内容可能有不到之处,欢迎交流。 未经本人,允许禁止转载。由于最近本人在搞算法时,如下图所示,遇到Gamma求一阶导数及二阶导数,所以找了相关资料,学习了一下。打公式实在有些费劲,所以这里直接将手稿贴出来,供有需要的人学习。原创 2017-05-10 18:48:08 · 37298 阅读 · 3 评论