- 博客(2)
- 收藏
- 关注
原创 大模型零基础入门(从词袋法到词嵌入)
加log在分母较小的时候减少影响 稀有性:和总文档集合有关 不用一次一次计算。关键词应该是特别的 稀有的(Exp:"的")->需要同时考量词频和稀有度。计算损失->前向传播 根据损失更新参数->反向传播。(可用于抽取关键词 取TF*IDF最高为关键词)特征传递信息:有没有这个词(辨别垃圾邮件)(输入词 )->预测词和目标词比较计算损失。计算相似性S正 S负1 负2 负3...之后 保留词语向量矩阵(即嵌入矩阵)(“你爱我”“我爱你”)(“苹果”)BGE模型的训练核心 ->对比学习。
2025-11-09 16:10:20
249
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅