深度学习书籍
文章平均质量分 92
CodeCyber
Ctrl+C/V 工程师
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
深度学习 基础与概念 第三章注解
本文探讨了密度估计的核心方法——最大似然估计(MLE)及其理论基础。首先指出密度估计的本质是通过观测数据推断潜在概率分布,需经过模型选择、参数确定和密度函数构建三个步骤。重点分析了MLE的合理性,从频率主义视角、信息论角度(与KL散度的等价性)进行解释,并通过高斯分布的实例验证MLE与最小KL散度的一致性。文章深入剖析了似然函数的数学定义,强调其作为参数函数而非概率分布的特性,并引入充分统计量的概念说明数据压缩原理。最后从最大熵原理出发,证明在给定均值和方差约束下,高斯分布是使熵最大化的唯一分布,揭示了高斯原创 2025-08-16 21:53:27 · 443 阅读 · 0 评论 -
深度学习 :基础与概念 (第一章注解)
本文阐述了深度学习中的关键概念与方法。首先解释了自监督学习的机制,通过自动生成训练对来训练模型,无需人工标注。接着介绍了自回归语言模型的生成原理及其对话交互的实现方式。在模型优化方面,讨论了平方和误差函数的解析解和正则化技术(包括收缩方法和权重衰减),强调正则化系数λ作为超参数需独立设定。最后指出数据集应划分为训练集、验证集和测试集,以防止模型过拟合。这些技术共同构成了现代深度学习的基础框架。原创 2025-06-17 00:15:45 · 734 阅读 · 0 评论
分享