
贝叶斯相关模型及程序
文章平均质量分 94
HFUT_qianyang
刘老师指示:学如逆水行舟,不进则退;心似平原跑马,易放难收。不能放松,继续!
展开
-
双稀疏主题模型(Dual-Sparse Topic Model)编程实现中的细节 Java
本文作者:合肥工业大学 电子商务研究所 钱洋 email:1563178220@qq.com 。内容可能有不到之处,欢迎交流。未经本人允许禁止转载。文章目录论文来源相关介绍单稀疏模型双稀疏模型模型推理Java编程实现的细节论文来源Lin T, Tian W, Mei Q, et al. The dual-sparse topic model: mining focused topics ...原创 2019-07-04 10:17:19 · 1602 阅读 · 0 评论 -
Collapsed Variational Inference(Collapsed变分推断)算法以LDA推导为例
简介Collapsed Variational Inference(CVI)来源于下面这篇文章:Teh Y W, Newman D, Welling M. A collapsed variational Bayesian inference algorithm for latent Dirichlet allocation[C]//Advances in neural information ...原创 2019-02-16 11:14:53 · 1974 阅读 · 1 评论 -
变分推断之高斯混合模型(案例及代码)
本文作者:合肥工业大学 管理学院 钱洋 email:1563178220@qq.com 内容可能有不到之处,欢迎交流。未经本人允许禁止转载。案例来源本博客讲解的案例来源于于Journal of the American Statistical Association期刊(顶刊)上的内容:Blei D M, Kucukelbir A, McAuliffe J D. Variational i...原创 2019-01-29 19:15:47 · 16842 阅读 · 9 评论 -
变分推断以及在概率图模型中的应用
变分推断以前都是搞Gibbs采样,最近找国外导师的时候发现有必要学习一下变分推理。平均场理论来源于物理学,是一种研究复杂多体问题的方法,将数量巨大的互相作用的多体问题转化成每一个粒子处在一种弱周期场中的单体问题。如果将其应用到图模型中,可以将相互作用的多体看成相互作用的变量:变分贝叶斯推断LDA的变分推断Supervised topic models变分推断...原创 2019-01-25 12:36:25 · 10617 阅读 · 8 评论 -
识别和追踪主题层次的影响力者(来自2018 Machine Learning 论文学习笔记)
本文作者:合肥工业大学 管理学院 钱洋 email:1563178220@qq.com 。以下内容是个人的论文阅读笔记,内容可能有不到之处,欢迎交流。未经本人允许禁止转载。文章目录论文来源论文学习笔记论文来源来自于2018年Machine Learning期刊上的论文。Su S, Wang Y, Zhang Z, et al. Identifying and tracking topic...原创 2018-11-05 15:33:00 · 1406 阅读 · 0 评论 -
2018 A Sparse Topic Model for Extracting Aspect-Specific Summaries from Online Reviews 稀疏主题模型学习笔记
论文来源文章介绍模型及推理关于源码论文来源Rakesh V, Ding W, Ahuja A, et al. A Sparse Topic Model for Extracting Aspect-Specific Summaries from Online Reviews[C]//Proceedings of the 2018 World Wide Web Confere...原创 2018-07-09 17:22:56 · 1149 阅读 · 0 评论 -
LSTM模型结合LDA对序列性文本建模 阅读笔记 2017 ICML
本文作者:合肥工业大学 管理学院 钱洋 email:1563178220@qq.com 内容可能有不到之处,欢迎交流。未经本人允许禁止转载。文章来源 Zaheer M, Ahmed A, Smola A J. Latent LSTM Allocation: Joint Clustering and Non-Linear Dynamic Modeling of Sequence Dat...原创 2018-06-04 10:40:26 · 3852 阅读 · 0 评论 -
极大似然估计求解多项式分布参数
原因今天晚上,老师在看LDA数学八卦的时候,问我一个问题,如下图所示: 这个多项式分布的参数,采用极大估计是怎么求的呢?当时想了想还真不知道,于是在网上找了资料,学习了一下,特此记录。公式推导很多情况下,假定一个变量XX有kk个状态,其中k>2k>2,每个状态假定的可能性为p1,p2,⋯,pkp_{1},p_{2},\cdots ,p_{k},且∑ki=1pi=1\sum _{i=1}原创 2018-05-07 22:16:46 · 13512 阅读 · 6 评论 -
主题模型聚类匹配2018TKDE阅读笔记(Topic Models for Unsupervised Cluster Matching)
论文来源 Iwata T, Hirao T, Ueda N. Topic Models for Unsupervised Cluster Matching[J]. IEEE Transactions on Knowledge and Data Engineering, 2018, 30(4): 786-795.作者是日本人Iwata T,也是个机器学习大牛,每年都有一系列的文章出来,还是很厉害的。原创 2018-04-21 17:16:37 · 2173 阅读 · 1 评论 -
LFDMM源码剖析(融入词向量的概率图模型)
本文作者:合肥工业大学 管理学院 钱洋 email:1563178220@qq.com 内容可能有不到之处,欢迎交流。 未经本人允许禁止转载。论文来源Nguyen D Q, Billingsley R, Du L, et al. Improving topic models with latent feature word representations[J]. Transacti...原创 2018-03-24 10:40:58 · 1731 阅读 · 1 评论 -
Java中Gamma、Beta等函数
math3实现Gamma函数在math3中提供了Gamma函数:Gamma.gamma(double a)log2 Gamma函数 private double logOn2Gamma(double value) { return com.aliasi.util.Math.log2Gamma(value); }beta函数的形式以下为beta函数的形式:math3实现be...原创 2019-02-19 15:48:37 · 2915 阅读 · 0 评论 -
指数分布族(Exponential Family)相关公式推导及在变分推断中的应用
本文作者:合肥工业大学 管理学院 钱洋 email:1563178220@qq.com 内容可能有不到之处,欢迎交流。未经本人允许禁止转载。文章目录指数分布族的概念典型分布转化Bernoulli分布Poisson分布Gaussian分布多元Gaussian分布Multinomial分布变分推断应用参考内容指数分布族的概念指数分布族是一系列分布的统称,包含连续和离散的相关分布。例如,正太分布...原创 2019-02-14 11:25:04 · 20805 阅读 · 4 评论 -
Partially Labeled Dirichlet Allocation(PLDA)算法的理解与编程细节(Java)
本文作者:合肥工业大学 电子商务研究所 钱洋 email:1563178220@qq.com 。内容可能有不到之处,欢迎交流。未经本人允许禁止转载。文章目录论文来源模型论文来源Ramage D, Manning C D, Dumais S. Partially labeled topic models for interpretable text mining[C]//Proceedin...原创 2019-06-24 22:32:47 · 1446 阅读 · 1 评论 -
HDP(层次狄利克雷过程)算法代码实现细节梳理(Java)
本文作者:合肥工业大学 电子商务研究所 钱洋 email:1563178220@qq.com 。内容可能有不到之处,欢迎交流。未经本人允许禁止转载。文章目录HDP简介有向图表示CRF的关键HDP的采样编程角度解读采样桌子采样主题完整代码参考HDP简介Teh Y W, Jordan M I, Beal M J, et al. Sharing clusters among related g...原创 2019-06-23 10:42:09 · 8232 阅读 · 3 评论 -
变分推断中的ELBO(证据下界)
变分推断简介变分推理的目标是近似潜在变量(latent variables)在观测变量(observed variables)下的条件概率。解决该问题,需要使用优化方法。在变分推断中,需要使用到的一个重要理论,是平均场理论,读者可以参考我的另外一篇博客:https://qianyang-hfut.blog.youkuaiyun.com/article/details/86644192变分推断等价于最小化...原创 2019-06-20 20:36:21 · 54800 阅读 · 6 评论 -
贝叶斯分层回归模型的推理、EM求解和Java编程
模型如下为模型:这个模型中,参数和协方差服从正太逆Wishart先验。根据模型,给出所有变量的联合似然,即:公式推理因变量和权重的联合概率分布可表示为:求对数:其中,EM求解令:则:编程下面,给出了EM算法迭代的核心代码:/**EM UPDATE * @author Qianyang * ****/public static Map<In...原创 2019-06-11 09:33:29 · 3400 阅读 · 0 评论 -
Labeled LDA(有监督)主题模型的理解、推理与编程
本文作者:合肥工业大学 管理学院 钱洋 email:1563178220@qq.com 。以下内容是个人的论文阅读笔记,内容可能有不到之处,欢迎交流。未经本人允许禁止转载。文章目录算法来源算法简介背景Labeled LDA模型参数学习编程实现算法来源这个算法来源于:Ramage D, Hall D, Nallapati R, et al. Labeled LDA: A supervis...原创 2019-06-04 16:15:33 · 11148 阅读 · 3 评论 -
多元正态分布、多元t分布中的行列式求解 Java
文章目录背景math3求解行列式的值背景在编写多元正太分布函数和多元t分布函数时,常遇到要求解,协方差矩阵对应行列式的值。math3求解行列式的值在math3中提供了求解行列式值的方法,下面将以一个具体案例,介绍其使用。如下为Java代码:package test.SundataPro;import org.apache.commons.math3.linear.Array2...原创 2019-06-05 21:02:55 · 1917 阅读 · 0 评论 -
Collaborative topic modeling(推荐)算法实现中的大数组问题
问题背景最近,在使用Java实现一个个性化推荐算法时,遇到了非常常见的问题。实现的算法为:Wang C, Blei D M. Collaborative topic modeling for recommending scientific articles[C]//Proceedings of the 17th ACM SIGKDD international conference on Kn...原创 2019-05-31 17:39:53 · 1115 阅读 · 0 评论 -
Java实现多元t分布函数(Multivariate t distributions)
本文作者:合肥工业大学 管理学院 钱洋 email:1563178220@qq.com 内容可能有不到之处,欢迎交流。未经本人允许禁止转载文章目录问题背景编程实现问题背景最近,在独立实现Gaussian LDA算法时,遇到了Multivariate t distributions。Gaussian LDA对应的论文是:Das R, Zaheer M, Dyer C. Gaussian l...原创 2019-06-05 17:34:38 · 3967 阅读 · 0 评论 -
Incorporating Lexical Priors into Topic Models(即交互式主题模型的应用)论文阅读
论文来源论文来自于自然语言处理会议ACLJagarlamudi J, Daumé III H, Udupa R. Incorporating lexical priors into topic models[C]//Proceedings of the 13th Conference of the European Chapter of the Association for Computat...原创 2019-03-30 11:19:08 · 688 阅读 · 0 评论 -
Pseudo-document-based Topic Model(基于伪文档的主题模型)的理解以及源码解读
论文来源Zuo Y, Wu J, Zhang H, et al. Topic modeling of short texts: A pseudo-document view[C]//Proceedings of the 22nd ACM SIGKDD international conference on knowledge discovery and data mining. ACM, 2016:原创 2018-04-10 10:49:38 · 1760 阅读 · 1 评论 -
轮盘赌算法的java实现算例
轮盘赌介绍 算法实现package test;public class Test { public static double[] multiPros; public static void main(String[] args) { multiPros = new double[4]; multiPros[0] = 0.14;原创 2018-03-21 10:17:11 · 5174 阅读 · 0 评论 -
Topic model相关文章总结
基础类主题模型Hofmann T. Probabilistic latent semantic indexing[C]//Proceedings of the 22nd annual international ACM SIGIR conference on Research and development in information retrieval. ACM, 1999: 50-57.Ble原创 2017-11-07 10:58:19 · 3114 阅读 · 0 评论 -
sparseTM的公式理解
本篇的论文来自:Wang C, Blei D M. Decoupling sparsity and smoothness in the discrete hierarchical dirichlet process[C]//Advances in neural information processing systems. 2009: 1982-1989.本博客作者:合肥工业大学 管理学院 钱洋 e原创 2017-05-08 22:20:31 · 883 阅读 · 2 评论 -
二项分布的采样或抽样(java实现)
如下程序为n=100,p=0.9的二项分布采样,共采样10000次package function;import org.apache.commons.math3.distribution.BetaDistribution;import org.apache.commons.math3.distribution.BinomialDistribution;import org.apache.com原创 2017-05-12 16:04:01 · 5057 阅读 · 3 评论 -
beta分布的采样或抽样(java程序)
关于beta分布的介绍,请看我的另外一篇博客:http://blog.youkuaiyun.com/qy20115549/article/details/53307535本文将使用math3提供的工具包,对beta分布进行采样。如下程序是对alpha=81,beta=219的beta分布函数,进行抽样,共采样10000次。package function;import org.apache.commons.ma原创 2017-05-12 15:42:20 · 6480 阅读 · 3 评论 -
Dirichlet Process and Stick-Breaking(DP的Stick-breaking 构造)
目录Dirichlet Process简介Stick-Breaking构造Dirichlet Process简介DP是一种非参数贝叶斯模型, 其优点是参数的个数和性质灵活可变, 可通过模型和数据来计算数目, 近年来它已成为机器学习和自然语言处理研究领域中的一个研究热点。举个例子,我们在使用聚类方法k-means时,需要指定k的值(聚成k个簇);在使用LDA时需要指定主题的数目k,但通过DP过程这种原创 2017-03-14 13:39:49 · 6707 阅读 · 0 评论 -
Author Topic Model[ATM理解及公式推导]
参考论文Modeling documents with topicsModeling authors with wordsThe author-topic modelGibbs sampling algorithms详细经典LDA模型目标分布及参数Author Model目标分布及参数Author-topic model目标分布及参数本文作者:合肥工业大学 管理学院 钱洋 email:原创 2017-01-13 11:34:13 · 4395 阅读 · 6 评论 -
Correlated Topic model 的Gibbs sampling
原文来自师兄的博客:http://blog.youkuaiyun.com/wjj5881005/article/details/53320577关于经典LDA的thetaCorrelated Topic Model中的thetaCTM的Gibbs sampling1 CTM中关于主题zz的采样2 CTM中关于文档主题分布参数eta的后验分布3 CTM中关于文档主题分布参数eta的Gibbs sampl转载 2016-12-09 09:17:42 · 2557 阅读 · 0 评论 -
LDA的Gibbs抽样详细推理与理解
LDA图模型表示LDA所要求得目标分布联合概率分布求解参考文献本文作者:合肥工业大学 管理学院 钱洋 email:1563178220@qq.com 欢迎交流。LDA图模型表示LDA所要求得目标分布关于LDA的理解,可以去看《LDA数学八卦》以及Heinrich G. Parameter estimation for text analysis[J]. University of Leip原创 2016-12-11 21:19:33 · 5441 阅读 · 1 评论 -
关于多元正态分布的条件概率密度
原文来自师兄的博客:http://blog.youkuaiyun.com/wjj5881005/article/details/53320403多元正态分布多元正态分布的条件密度多元正态分布多元正态分布的密度函数如下 : fx(x1,...xn)=1(2π)k√|Σ|1/2exp(−12(x−μ)TΣ−1(x−μ))f_{x}(x_{1},...x_{n})=\frac{1}{\sqrt{(2\pi)^{转载 2017-01-10 21:16:23 · 12421 阅读 · 0 评论 -
Indian Buffet Process(印度自助餐过程)介绍
简介无监督学习的目的是从观测数据中,发掘潜在的结构(latent structure)。无监督学习算法的一个关键问题是如何确定潜在结构的数目,如聚类中的类的数目,变量的数目等。以聚类为例,如果能够基于数据之间的内在关系,自动学习类的数目,要比通过经验设置一个数目要好的多。相比参数化的贝叶斯模型,非参贝叶斯有其独特的地方,也是近些年来,机器学习比较火的一种方法,如DPMM(Dirichlet proc原创 2017-11-14 17:30:43 · 7223 阅读 · 0 评论 -
对比关系生成模型(Comparative Relation Generative Model)
文章来源Tkachenko M, Lauw H W. Comparative Relation Generative Model[J]. IEEE Transactions on Knowledge and Data Engineering, 2017, 29(4): 771-783. 2017年TKDE上的文章,以下仅是个人理解,仅供参考,详细内容请学习原文。个人想法从评论中找原创 2018-01-26 16:50:30 · 999 阅读 · 0 评论 -
蒙特卡罗方法采样算法
蒙特卡罗方法采样算法 蒙特卡罗方法(Monte Carlo Simulation)是一种随机模拟(或者统计模拟)方法。 给定统计样本集,如何估计产生这个样本集的随机变量概率密度函数,是我们比较熟悉的概率密度估计问题。 求解概率密度估计问题的常用方法是最大似然估计、最大后验估计等。但是,我们思考概率密度估计问题的逆问题:给定一个概率分布p(x),如何让计算机生成满足这个概率分布的样本。 这个问转载 2018-03-21 10:00:58 · 48629 阅读 · 5 评论 -
Dirichlet Process和Hierarchical Dirichlet Process的理解(PPT)
本文作者:合肥工业大学 管理学院 钱洋 email:1563178220@qq.com 内容可能有不到之处,欢迎交流。 未经本人允许禁止转载。原创 2018-03-23 09:59:48 · 4883 阅读 · 1 评论 -
基于狄利克雷-多项式分布做文档聚类代码(dirichlet multinomial mixture model)
论文来源Yin J, Wang J. A dirichlet multinomial mixture model-based approach for short text clustering[C]//Proceedings of the 20th ACM SIGKDD international conference on Knowledge discovery and data mining.原创 2018-03-05 19:35:04 · 4013 阅读 · 0 评论 -
Gaussian LDA(高斯LDA)简介
论文来源Das R, Zaheer M, Dyer C. Gaussian lda for topic models with word embeddings[C]//Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joi原创 2018-03-12 16:21:12 · 3688 阅读 · 0 评论 -
Sentence-LDA的介绍及程序
Sentence-LDA的相关论文:Jo Y, Oh A H. Aspect and sentiment unification model for online review analysis[C]//Proceedings of the fourth ACM international conference on Web search and data mining. ACM, 2011: 81原创 2017-08-16 20:36:40 · 4921 阅读 · 1 评论 -
主题模型结合词向量模型(Improving Topic Models with Latent Feature Word Representations)
本文作者:合肥工业大学 管理学院 钱洋 email:1563178220@qq.com 内容可能有不到之处,欢迎交流。 未经本人允许禁止转载。论文来源Nguyen D Q, Billingsley R, Du L, et al. Improving topic models with latent feature word representations[J]. Transactions of原创 2018-03-07 20:17:50 · 4156 阅读 · 1 评论