- 博客(22)
- 收藏
- 关注
原创 做RAG的开发者如何选择合适的开源项目
“所以我应该先给我的RTX 3080(12G显存)装一个FastGPT,用Qwen-7B的量化版本来入门,等熟悉了整个流程后再考虑更复杂的系统,比如LlamaIndex?它既提供了足够好的性能,又不会让你的显卡‘吃不消’,社区支持也很好。把它想象成买车:你不会只看哪辆车性能最强,而是会根据你的预算、日常通勤距离、家庭人数来做出最合适的选择。这是一个非常棒的问题,也是所有做RAG的开发者都会遇到的核心决策点。:希望有更好的效果和更快的响应速度,能跑动一些有规模的模型。现在,我们来看看每个档位具体该怎么选。
2025-10-22 16:08:59
499
原创 大模型训练优化和推理优化有什么不同的地方
特性训练 (Training)推理 (Inference)核心目标学习知识、模型收敛、稳定性低延迟、高吞吐、低成本主要瓶颈计算密集型通信密集型显存容量内存带宽密集型显存容量计算模式完美的批量并行自回归生成(逐个Token,难以并行)关键数据模型参数、优化器状态梯度激活值模型参数、KV Cache典型技术混合精度、分布式训练(FSDP)、梯度检查点、ZeRO量化GQA/MQA连续批处理、专用推理框架训练关注的是如何高效地一次性学会,而推理关注的是如何高效地重复使用学到的知识。
2025-09-19 16:28:41
318
原创 `__lt__`(小于)、`__gt__`(大于)等方法用于比较操作
在Python中,魔法方法(Magic Methods)或特殊方法(Special Methods)是以双下划线开头和结尾的方法,用于实现类的特定行为。__lt__(小于)、__gt__(大于)等方法用于比较操作,允许自定义对象之间的比较逻辑。
2025-08-18 10:44:43
368
原创 二进制、补码与位运算基础
这段代码巧妙利用了位运算来处理Python中负数的特殊表示,确保能正确统计任意整数(包括负数)的二进制表示中1的个数。二进制表示补码概念Python的整数存储方式位运算基础希望这个解释能帮助你理解!如果还有不清楚的地方,可以继续提问。
2025-08-07 16:41:11
348
原创 Python 类中的特殊方法(魔术方法)的泛化性
Python 通过魔术方法实现了**“约定优于配置”**的设计哲学,只要类遵循协议(实现对应方法),就能获得强大的功能扩展能力。:只要类实现了对应的魔术方法,就可以无缝集成到 Python 的生态中。Python 不强制类型继承,只要对象实现了特定方法(如。(Protocol),而非严格的接口继承。通过魔术方法,可以自定义运算符的行为(如。Python 的运算符、内置函数(如。通过实现魔术方法,自定义类可以像。)等底层都依赖特殊方法。等内置类型一样工作。等),使类的用法更直观。开头和结尾的方法(如。
2025-07-27 15:28:23
770
原创 链接 Hugging Face 时出现超时问题
链接 Hugging Face 时出现超时问题,可能是由于网络限制或镜像源不稳定导致的。如果仍有问题,可以提供具体的错误日志,我会进一步帮你分析!
2025-06-25 10:24:50
2164
原创 大模型算法工程调试惯用思路
在算法工程中,高效的调试思路往往需要结合对模型行为的深入分析、数据分布的洞察以及实验设计的严谨性。以下是其他一些类似的有效调试思路,适用于大模型(LLM/CV等)或其他复杂算法的开发场景:这些思路与你的原始案例一脉相承,核心是通过观察模型行为和数据反馈,逆向推理问题根源,而非盲目调参或增加复杂度。
2025-06-24 14:51:22
585
原创 在 VSCode 中进行 Python 开发时实现全屏模式及提升舒适度的功能
默认情况下,VSCode 不包含对 Python 的内置支持。安装 Python 扩展会显著改善开发体验,提供诸如 IntelliSense、调试支持、Linting 和代码格式化等功能。VSCode 提供了多种方式来优化开发体验,包括全屏模式、无干扰模式以及通过快捷键和扩展功能进一步提升开发效率。可以通过自定义快捷键来加速常用操作。VSCode 支持两种全屏模式:标准全屏和无干扰模式。设置为一键创建新终端并聚焦到终端窗口的操作。
2025-06-17 15:56:23
433
原创 Conda 和 Docker的区别
如果项目内部还需要更灵活的 Python 包管理(例如项目A同时需要 TensorFlow 1.15 和 Scikit-learn 0.20,但这两个库的依赖冲突),可以在 Docker 容器内再使用 Conda。这两个项目的依赖冲突严重(Python 版本、CUDA 版本、库版本均不同),你需要同时开发它们。我用一个具体的例子对比。
2025-05-26 11:11:26
1178
1
原创 如何不费脑力但是有质量应对导师给你安排的审稿?
使用Coze智能体辅助审稿,不仅能提高效率,还能保证审稿质量的一致性。我个人的使用体验是:审稿时间从原来的4-6小时/篇缩短到1-2小时,而且意见更加全面专业。最重要的是,这个方法让我在审稿过程中也能学习到领域最新进展,真正实现"审一篇,学一片"。也欢迎在评论区分享你的审稿心得或Coze使用技巧~#科研工具 #论文审稿 #Coze #AI辅助 #研究生必备d。
2025-05-14 17:30:39
485
原创 即使不懂编程术语,也可以通过理解技术栈的基本逻辑和AI协作实现降本增效
即使不懂编程术语,也可以通过理解技术栈的基本逻辑和AI协作实现降本增效。以下是针对非技术背景人员的实战策略,分为和。
2025-05-14 14:30:38
655
原创 目前程序员的困境是什么?哪条路径是大势所趋?
当前程序员面临技术迭代快、AI冲击、职业内卷和工程复杂度攀升等困境。AI工具如GitHub Copilot已能自动生成基础代码,但关键路径和复杂逻辑仍需人工编写。未来,AI将成为标配工具,开发者需掌握提示词工程,精准引导AI生成代码,并转向系统架构设计和优化AI输出结果。垂直领域深度专业化、低代码/无代码的边界拓展、基础设施即代码(IaC)与DevOps以及人机协作范式将是未来大势所趋。程序员应拥抱AI工具,提升不可替代性,并关注业务价值,成为“会指挥AI的架构师”。
2025-05-14 14:08:54
309
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅