自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Transformer框架

与编码器类似,但为了防止模型在训练时“偷看”未来的答案(即预测第t个词时,只能看到1到t-1的词),通过一个掩码(Mask)将未来的位置设置为负无穷,使其Softmax权重为0。通过这个过程,模型在编码“it”时,就会给“animal”分配极高的权重,从而生成一个能明确指代“animal”的“it”向量表示。今天,就让我们一同揭开Transformer的神秘面纱,看看这个没有循环、没有卷积的结构,是如何主宰NLP世界的。通过计算一个词的Query与序列中所有词的Key的点积,得到注意力分数。

2025-11-27 09:46:16 621

原创 生成式AI的统计内核与模型全景

它将数据的生成过程表述为:从一个先验分布 p(z)p(z)(如标准正态分布)中采样一个潜在变量 zz,然后通过解码器 p(x∣z)p(x∣z) 生成数据 xx。:模型学到的分布 Pmodel(x)Pmodel​(x) 会尽可能地接近 Pdata(x)Pdata​(x)。公式:P(A∣B)=P(B∣A)P(A)P(B)P(A∣B)=P(B)P(B∣A)P(A)​。:直接使用KL散度作为损失的一部分,迫使编码器输出的潜在变量分布 q(z∣x)q(z∣x) 接近标准正态先验分布 p(z)p(z)。

2025-11-06 09:40:54 771

原创 机器学习:使用线性回归预测房价

关键点:线性回归适用于房价预测时特征与目标呈线性关系。通过可视化、预处理和训练,模型能有效学习模式。预测结果为点估计(如 320000 元),但实际应用中建议使用交叉验证提高鲁棒性。可靠性:本方法基于真实机器学习实践,但结果依赖数据质量。建议在真实数据集上测试,并比较不同模型(如决策树)。

2025-10-30 09:48:38 304

原创 人工智能发展历程与兴衰

萌芽期(1950-1974)第一次寒冬(1974-1980)复兴期(1980-1987)第二次寒冬(1987-1993)稳步发展期(1993-2011)周期性特征:历史教训:

2025-10-16 09:25:26 417

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除