- 博客(14)
- 收藏
- 关注
原创 softmax回归遇到的训练集准确率小于测试集准确率的问题
在训练初期,模型可能在某些batch中表现较差(尤其是初始batch),导致训练集整体准确率被拉低。),模型逐渐适应训练数据,训练集准确率会稳步提升并超过测试集。模型在初始阶段可能对训练数据欠拟合,而测试集的数据特性(如某些类别的偏向性)可能与初始参数偶然匹配,从而在测试集上表现更好。测试集可能包含更多简单样本或类别分布更均衡,在模型未充分训练时,这些样本的分类更容易,导致测试集准确率暂时高于训练集。),参数的剧烈调整可能导致训练集预测结果波动较大,而测试集在某个中间参数状态下可能偶然表现更好。
2025-03-16 15:15:26
392
原创 PyTorch vs NumPy:核心区别与选择指南
NumPy是科学计算的瑞士军刀,适合通用数值计算。PyTorch是深度学习研究的超级工具箱,提供从张量操作到模型部署的全套解决方案。二者可通过和.numpy()方法高效协同,建议根据具体需求灵活选择!TIP:在深度学习项目中,通常使用NumPy进行数据预处理,再转换为PyTorch张量进行模型训练。
2025-03-13 19:48:39
1723
1
原创 Kneser-Ney平滑在自然语言处理中的应用
Kneser-Ney平滑是一种自然语言处理中先进的语言模型平滑技术,用于解决n-gram模型因数据稀疏而导致的概率估计问题。其核心方法是通过从高阶n-gram的计数中减去一个固定的折扣值,并结合低阶n-gram的信息重新分配概率质量,从而为未出现的n-gram提供合理的概率估计。这种技术在大规模数据集上表现优异,广泛应用于语音识别、机器翻译等领域。Kneser-Ney平滑的主要优点包括有效利用低阶信息、在大型语料库上实现低困惑度,但其实现复杂度较高且需调整折扣参数。与其他平滑方法相比,Kneser-Ney平
2025-03-03 23:23:46
964
原创 【深度剖析】古德-图灵估计:从密码破译到NLP的统计革命
👨💻 作者:RedefineLim⏰ 发布时间:2025-3-2#统计建模#语言模型#信息论✉️ 版权声明:原创内容,转载需授权!
2025-03-02 16:47:23
1154
原创 (学会二叉树) 二叉树基础
二叉树(Binary Tree)是n(n≥0)个结点的有限集合,该集合或者为空集(称为空二叉树),或者由一个根结点和两棵互不相交的、分别称为根结点的左子树和右子树的二叉树组成。我们不妨看一个例子:我在纸上已经写好了一个100以内的正整数数字,请大家想办法猜出我写的是哪一个?注意你们猜的数字不能超过7个,我的回答只会告诉你是“大了”或“小了”。这个游戏在一些电视节目中,猜测一些商品的定价时常会使用。
2024-06-05 17:13:07
984
8
原创 C语言指针知识点大全
数组指针是指针?还是数组?答案是:指针。我们已经熟悉: 整形指针: int * pint;能够指向整形数据的指针。浮点型指针: float * pf;能够指向浮点型数据的指针。那数组指针应该是:能够指向数组的指针。下面代码哪个是数组指针?//p1, p2分别是什么?解释://解释:p先和*结合,说明p是一个指针变量,然后指着指向的是一个大小为10个整型的数组。//所以p是一个指针,指向一个数组,叫数组指针。//这里要注意:[]的优先级要高于*号的,所以必须加上()来保证p先和*结合。OK!
2024-03-07 22:26:51
3187
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅