- 博客(7)
- 收藏
- 关注
原创 强化学习 (Reinforcement Learning) 浅析
我只使用文字分析大致的概念和公式, 相关算法的代码在网上有很多现成的可以扒, 都写在这篇文章里会很冗余, 大家对代码感兴趣的去搜一下即可.
2025-02-09 19:59:13
941
原创 DeepSeek-V3 的核心架构: DeepSeekMoE
实践效果:在671B总参数量下实现单 token 仅激活3.7%参数,推理速度提升2.1倍,训练成本降低67%。以上纯个人总结及观点, 如有错误, 还请大佬们指教。
2025-02-03 08:30:00
1133
原创 Windows部署Ollama可视化(Open WebUI + Docker + Ollama)
登录Ollama官网()点击Download进行下载。
2025-01-07 22:46:18
4461
2
原创 Lil‘Log《Extrinsic Hallucinations in LLMs》读后总结
博客《Extrinsic Hallucinations in LLMs》由Lilian Weng撰写,详细探讨了大型语言模型(LLMs)中“幻觉”现象的背景、原因、类型、影响及其缓解策略。本文对这一问题进行了深刻的剖析,结合了大量实例,提供了清晰的思路和可能的解决方案。以下是我该文章的总结和分析。
2024-12-13 19:56:38
491
原创 智能体(Agent)与工作流(Workflow)
工作流(Workflow)是一种描述业务过程的方法,它将工作流程中的各个步骤和规则抽象化,并通过计算机技术来实现这些流程的自动化。优点缺点Agent动态规划灵活缺乏稳定性Workflow静态规划稳定性高缺乏灵活性完成复杂的任务缺乏稳定性。
2024-11-08 18:47:27
12648
原创 背包问题-动态规划算法(附带Python代码解析)
给定 n 种物品和一个容量为 capacity 的背包,其中每一个物品的重量和价值已知。问:应该如何选择装入背包的物品,使得装入背包中的物品的总价值最大?
2024-09-18 22:01:06
1598
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人