
机器学习
文章平均质量分 96
夏树让
记录
展开
-
从线性代数角度理解 PageRank 算法细节 (包含基于 NumPy 的代码实现)
描述 PageRank 算法的中心思想,并从线性代数角度解释 PageRank,阐述 PageRank 需要应对的两大问题:悬挂节点 (dangling nodes) 问题 和 非强连通图问题。给出了 PageRank 基于 NumPy 的实现。强连通图 (strongly connected graph),随机矩阵 (stochastic matrix),正矩阵 (positive matrix)。原创 2021-11-30 20:52:00 · 2334 阅读 · 0 评论 -
NLP 中的数据增强
NLP 常用数据增强方法:同义词替换(Synonym Replacement) 、回译(Back Translation)、文本生成(Text Generation)原创 2020-11-29 21:02:31 · 2394 阅读 · 0 评论 -
逻辑斯谛回归与最大熵模型(Logistic Regression and Maximum Entropy Model)
**逻辑斯谛回归**(logistic regression)是机器学习中的经典分类方法,可用于二类或多类分类;最大熵原理是概率学习或估计的一个准则,最大熵原理认为在所有可能的概率模型的集合中,熵最大的模型是最好的模型。将其推广到分类问题得到**最大熵模型**(maximun entropy model)。逻辑斯谛回归是最大熵模型的一个特例,只需将逻辑斯谛回归模型所隐含的模型约束条件引入到最大熵模型中即可导出逻辑斯谛回归模型。最大熵原理是概率模型学习的一种通用准则,可有效避免模型的过拟合。逻辑斯谛回归和原创 2020-04-03 12:02:13 · 720 阅读 · 0 评论 -
最大似然估计与最大后验估计之间的联系
最大似然估计(Maximum Likelihood Estimation,MLE) 和 最大后验估计(Maximun A Posterior,MAP) - 介绍 MLE 和 MAP 方法用于参数估计的大致步骤。 - 详细介绍 MLE 和 MAP,包括其原理和计算过程。 - 讨论 MLE 和 MAP 的联系。原创 2020-03-07 17:32:01 · 723 阅读 · 0 评论