- 博客(43)
- 收藏
- 关注
原创 代理编程工具研究
近年来,随着大模型(Large Language Model, LLM)技术的突破,AI辅助编程逐渐从简单的补全工具演化为能理解项目全局、随时执行常规指令的“代理编程”(Agentic Coding)系统。本文基于当前行业发展趋势及最新研究成果,聚焦Claude Code的技术特点与实践经验,梳理代理编程工具所面临的挑战,并对相关工作进行综述与探讨。
2025-02-26 17:01:43
793
原创 DeepEP简介
为了与 DeepSeek-V3 论文中提出的 group-limited gating 算法保持一致,DeepEP 提供了一套针对非对称域带宽 forwarding 进行优化的内核,例如从 NVLink 域到 RDMA 域的数据 forwarding。在生成式人工智能中,混合专家模型(MoE)是一种采用多个专业化的“专家”子模型处理不同任务的模型架构。专家并行(EP)是混合专家模型(MoE)采用的一种技术,通过让多个专家(专业化的子模型)并行处理任务的不同部分,将工作负载分布到这些专家之间。
2025-02-26 10:56:52
494
原创 AI agent(以AutoGPT为例)和AI Workflow 区别
workflow能为明确定义的任务提供可预测性和一致性,而agent系统更适合需要灵活性和规模化模型驱动决策的场景
2025-02-24 16:06:24
1038
原创 翁丽莲 LLM Powered Autonomous Agents
大型语言模型(LLM)作为自主代理的核心控制器是一个创新概念。规划(包括任务分解和自我反思)记忆(包括短期和长期记忆)工具使用能力。这种系统通过LLM的推理能力,结合外部工具和记忆系统,可以完成复杂的认知任务。但当前这类系统仍面临上下文长度有限、长期规划困难、自然语言接口可靠性等挑战。
2025-02-24 11:01:48
753
原创 科研场景AI工具全景透视
2024年全球Top100高校中,61%建立AI科研协作中心,平均研发效率提升37%DeepSeek-R1在乳腺癌早期筛查中实现92.3%准确率(需配合专业影像设备)建议:建立动态评估机制,每季度更新工具组合;重要成果需通过3种以上模型交叉验证。Llama量子版成功预测23种新型超导材料结构(3篇Nature子刊待发表)
2025-02-20 11:31:44
821
原创 DeepSeek 新注意力架构NSA
原生稀疏注意力的两个关键优势:(1)预训练的稀疏注意力模式能够高效捕捉对复杂数学推导至关重要的长距离逻辑依赖关系;(2)该架构的硬件对齐设计保持了足够的上下文密度,以支持不断增长的推理深度,而不会出现灾难性遗忘。在不同上下文长度下的一致优势证实了稀疏注意力在原生集成到训练流程中时,对于高级推理任务的可行性。
2025-02-19 10:14:00
872
原创 pip warning ReadTimeoutError
错误如下表明在尝试从本地仓库()下载 TensorFlow 包时,连接在读取数据时超时了。以下是解决该问题的几种(治标不治本的)方法:(根本解决要分析机器网络带宽,链接问题,源的问题等)
2024-10-16 14:45:20
413
原创 MVP 最简可行产品
MVP(最小可行产品)是一种产品开发策略,其主要目的是用最少的时间和资源,开发一个包含最基本必要功能的产品。这样做的目的是能够以最小的成本进入市场,获取用户反馈,再根据反馈逐步优化产品。
2024-09-19 20:20:12
1307
原创 推理与训练,分布式训练
在人工智能领域,训练是指让机器学习模型做出准确推理的过程。训练可能涉及反复试错的过程,或者向模型展示期望输入和输出的示例,或者两者兼而有之。
2024-09-11 20:04:43
1018
原创 微服务中的Sidecar模式
sidecar是服务网络架构的产物。Sidecar,全称 Sidecar proxy,为在应用程序旁运行的单独的进程,它可以为应用程序添加许多功能,而无需在应用程序中添加额外的第三方组件,或修改应用程序的代码或配置。将应用程序的功能划分为单独的进程运行在同一个最小调度单元中(例如 Kubernetes 中的 Pod)可以被视为 sidecar 模式。在软件架构中, Sidecar 连接到父应用并且为其添加扩展或者增强功能。Sidecar 应用与主应用程序松散耦合。
2024-08-19 15:22:46
1669
1
原创 互联网技术之一 Markup
Markup (标记语言) 侧重于文本的结构和显示,适用于静态内容。Scheme Markup 在 Scheme 语言中是一种抽象化的数据或程序结构表示。
2024-08-18 11:29:05
1126
原创 6σ:数据驱动的管理方法
6σ是一种用于改善业务流程、减少缺陷和错误、极大限度减少差异、提高质量和效率的方法和工具。6σ的目标是达到近乎完美的质量水平,以进行业务转型,实现最佳客户满意度。
2024-08-02 12:22:03
842
原创 End-to-End Argument 一种系统设计指南
End-to-End Argument 在选择平台层/下层中要提供的功能时,类似于“奥卡姆剃刀”,有些功能只能在应用层“完全且正确地实现”,而在平台层(中间节点或底层系统)实现这些功能则是不可能的。虽然End-to-End原则在很多情况下是有效的,但也不是绝对的。
2024-08-01 11:49:32
835
原创 sloppy模型/sloppiness
sloppy模型或者sloppiness分析/算法:多参数的模型,其行为只取决于几个参数的严格组合,而参数的其它组合方式对模型预测来说并不重要。
2024-07-31 12:40:44
1339
原创 使用比特币进行匿名交易和交易追溯
题目:假设你是A国情报机关,需要给在J国执行任务的谍报人员提供活动经费,请问使用比特币如何操作才能躲过J国反谍机构的追查?J国反谍机构如何才能查出你的谍报人员?分别给出你的解决方案和J国反谍机构的解决方案。比特币交易本质上是公开的,每一笔交易都在区块链上公开记录,但交易者的身份是通过他们的公钥匿名的。然而,一旦一个公钥被关联到一个真实身份,那么与那个公钥相关的所有交易都可以被追踪。
2023-12-08 21:44:12
2713
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人