心碎小猫p-优快云博客

我只使用文字分析大致的概念和公式, 相关算法的代码在网上有很多现成的可以扒, 都写在这篇文章里会很冗余, 大家对代码感兴趣的去搜一下即可.

2025-02-09 19:59:13 1311

实践效果：在671B总参数量下实现单 token 仅激活3.7%参数，推理速度提升2.1倍，训练成本降低67%。以上纯个人总结及观点, 如有错误, 还请大佬们指教。

2025-02-03 08:30:00 1606

登录Ollama官网()点击Download进行下载。

2025-01-07 22:46:18 5331 2

博客《Extrinsic Hallucinations in LLMs》由Lilian Weng撰写，详细探讨了大型语言模型（LLMs）中“幻觉”现象的背景、原因、类型、影响及其缓解策略。本文对这一问题进行了深刻的剖析，结合了大量实例，提供了清晰的思路和可能的解决方案。以下是我该文章的总结和分析。

2024-12-13 19:56:38 617

工作流（Workflow）是一种描述业务过程的方法，它将工作流程中的各个步骤和规则抽象化，并通过计算机技术来实现这些流程的自动化。优点缺点Agent动态规划灵活缺乏稳定性Workflow静态规划稳定性高缺乏灵活性完成复杂的任务缺乏稳定性。

2024-11-08 18:47:27 26461

给定 n 种物品和一个容量为 capacity 的背包，其中每一个物品的重量和价值已知。问：应该如何选择装入背包的物品，使得装入背包中的物品的总价值最大？

2024-09-18 22:01:06 1850

常见的简单排序算法。

2024-09-13 18:23:40 1534 1

TA创建的收藏夹 TA关注的收藏夹

TA关注的人