
机器学习
文章平均质量分 94
机器学习笔记 新手上路 出错难免。有问题希望指出,一起进步塞
柏企
统计学硕士,从事大模型研发。人工智能相关发明专利3个。博客回复不及时,可添加微信:CBQtunan 个人公众号: 柏企阅文 欢迎关注
展开
-
LLM架构从基础到精通之循环神经网络(RNN)
LLM架构从基础到精通之循环神经网络(RNN)“以下是已更新文章:1. LLM大模型架构专栏|| 从NLP基础谈起2.LLM大模型架构专栏|| 自然语言处理(NLP)之建模3. LLM大模型架构之词嵌入(Part1)4. LLM大模型架构之词嵌入(Part2)5. LLM大模型架构之词嵌入(Part3)欢迎关注公众号【柏企科技圈】【柏企阅文】在人工智能的领域中,神经网络是推动技术发展的核心力量。今天,让我们深入探讨循环神经网络(RNN)及其重要变体——长短期记忆网络(LSTM)和门控循环原创 2025-01-09 13:36:31 · 929 阅读 · 0 评论 -
DeepSeek R1:了解GRPO和多阶段训练
策略模型根据给定输入q生成输出O;一个单独的价值模型预测基线v,与广义优势估计(GAE)一起用于计算优势A;奖励r包含使用参考模型和奖励模型计算出的KL惩罚项;这种架构会导致显著的资源开销。原创 2025-02-02 12:43:47 · 1513 阅读 · 0 评论 -
使用 DeepSeek-R1 等推理模型将 RAG 转换为 RAT,以实现更智能的 AI
检索增强思考(RAT)通过引入模仿人类思维过程的推理循环,弥补了这些差距。这使得它在以下应用场景中具有极高价值:复杂问题解答特定领域的AI助手研究密集型工作流程。原创 2025-02-02 12:42:56 · 1121 阅读 · 0 评论 -
微调特定于域的搜索的文本嵌入:附Python代码详解
📖阅读时长:20分钟🕙发布时间:2025-02-02欢迎关注知乎和公众号的专栏内容公众号【】【】 嵌入模型将文本表示为具有语义意义的向量。尽管它们可以很容易地用于无数的用例(例如检索、分类),但通用嵌入模型在特定领域的任务上可能表现不佳。克服此限制的一种方法是微调。在本文中,我将讨论这项技术背后的关键思想,并分享一个微调嵌入以将查询与AI招聘信息匹配的具体示例。文本嵌入模型的一个常见用途是检索增强生成(RAG)。原创 2025-02-02 12:41:27 · 1035 阅读 · 0 评论