- 博客(12)
- 收藏
- 关注

原创 GLM(广义线性模型) 与 LR(逻辑回归) 详解
本文对 GLM 广义线性模型 与 Logistic Regression 逻辑回归 相关话题进行了相对深入全面的解析,并提供大量数学证明。
2017-07-21 11:58:05
66310
7
原创 新词发现算法
新词发现基于统计的经典算法(无监督学习):基于已有的大量语料,枚举可能所有新词(原始字的顺序组合,限制长度为 n-gram),然后计算一些统计指标(主要是 凝固度、自由度)进行过滤,尽量准确地筛选出潜在的新词。产出的新词还是需要进行人工审核确认。凝固度这是一个类似互信息 Mutual Information 的概念,衡量两个字之间的相关性,是否经常“凝固”在一块儿出现,足够组成新的词。2-...
2019-06-30 19:45:51
4152
原创 GBM 与 GBDT 与 XgBoost
Gradient Boost Decision Tree 是当前非常流行的机器学习算法(监督学习),本文将从渊源起逐层讲解 GBDT,并介绍目前流行的 XgBoost。
2017-08-20 10:04:52
10004
原创 VJ框架 与 人脸检测/物体检测 详解
本文详细阐述 Viola-Joines 人脸检测/物体检测 实时处理框架,主要参考 Robust Real-Time Face Detection 这篇论文以及本人工程实践经验。
2017-08-17 22:29:03
8843
原创 Adaboost 详解
Adaboost (Adaptive Boosting) 详解本文会详细介绍 Adaboost 这一 ensemble 模型(属于 boosting类别)。从基本定义,详细实现到算法原理都会展开讲解。
2017-08-17 22:10:57
6309
2
原创 概率分布详解 Bernoulli、Binomial、Beta
Bernoulli、Binomial、Beta 分布是概率统计常用的基础,本文详细介绍、分析,并给出一个应用举例
2017-07-08 15:22:02
24067
1
原创 MLE (最大似然) 与 LS (最小二乘) 与 MAP (最大后验)
最大似然估计 属于机器学习中的常用的基础思想,很多具体的算法及模型都基于它建立,或者能够基于它找到解释。本文详细讨论这三者本身以及他们的关联
2017-05-06 08:56:34
11938
原创 Bayes Game
本文简单讲述一个有趣的经典的 Bayes定理 相关的小故事,展示了后验概率 posterior probability 出乎意料的威力
2016-08-31 02:33:02
810
原创 热力学与图像处理
在图像处理方面,我们从自然中汲取了大量灵感,例如射线、重力、水流等等物理学模型。其中最为常用的,似乎还是热力学模型,其抽象而简洁地描述了热传播、热均衡的过程。本文将对热力学模型展开细致讨论,不止揭露数学之美,更有自然之美。目录热力学模型
2016-07-29 18:11:03
4193
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人