步子哥
对于稍微复杂一些的问题,LLM不可能一步解决,需要一步步来。
简单来说就是 步子不能大,一步步推理,也就是 步子哥 这个昵称的由来。
AGI专家,20年的软件系统研发和管理经验。
欢迎来我的爱发电主页:https://afdian.com/a/steper
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
在联邦对比学习的镜子前:互信息的秘密
在当今的机器学习领域,数据的隐私和安全问题愈发重要,特别是在移动设备和物联网设备不断增加的背景下。如何在保证用户隐私的前提下进行有效的学习,成为了一个亟待解决的难题。Christos Louizos等人在他们的论文《A Mutual Information Perspective on Federated Contrastive Learning》中,提出了一种新颖的视角:通过互信息最大化,来改进联邦对比学习。本文将深入探讨他们的研究成果及其对未来研究的启示。原创 2024-08-20 23:32:41 · 524 阅读 · 0 评论 -
Agno Reasoning推理架构设计文档
Agno的推理架构是一个分层的、模块化的智能推理系统,旨在为AI代理提供结构化、可追溯、高性能的推理能力。该架构通过三层抽象模型,实现了从基础的推理模型到复杂的多智能体协作推理的完整覆盖。Agno推理架构基于以下核心设计理念:通过结构化的思维链(Chain of Thought)引导AI进行步骤化推理,确保推理过程的逻辑性和可验证性。将推理与工具调用相结合,使AI能够在推理过程中主动获取信息、执行计算、验证结果。采用分层架构设计,不同层次提供不同粒度的推理能力,满足从简单查询到复杂问题求解的需求。推理状态和原创 2025-11-23 23:26:04 · 28 阅读 · 0 评论 -
记忆的永生:当AI学会在数据库里做梦
的复合意图。原创 2025-11-23 15:17:00 · 61 阅读 · 0 评论 -
MindSearch 架构设计
MindSearch 是一个开源的 AI 搜索引擎框架,旨在模仿人类思维过程进行深度信息检索。项目的核心目标是构建一个能够理解复杂问题、自动分解任务、并行搜索信息并生成高质量回答的智能系统。原创 2025-11-23 10:34:04 · 14 阅读 · 0 评论 -
降噪的奥德赛:当Transformer穿越噪声迷宫,在像素海洋中寻找纯净的灯塔
同样地,所有人脸图像构成了一个低维流形:无论你换发型、变老、做鬼脸,你的核心面部特征在这个流形上的相对位置是稳定的。然而,令人意外的是,这位“大师”并没有直接修复你的照片,而是开始分析噪点的纹理、统计噪点的分布、预测下一颗噪点可能出现的精确位置。目前的研究热点,比如更复杂的噪声调度(cosine schedule、log-normal schedule)、更精巧的tokenizer设计(VQ-GAN、建议编码器)、多阶段训练策略(先训练tokenizer,再训练扩散模型,最后联合微调),都可能变得。原创 2025-11-23 10:15:37 · 28 阅读 · 0 评论 -
RL算法综述
In late 2025, a notable advancement came from a Nature publication where AI was used to discover new RL rules through meta-learning. This method leverages experiences from agents across diverse environments to evolve update rules for policies and predictio原创 2025-11-12 00:00:00 · 1608 阅读 · 0 评论 -
硅基觉醒:当开源社区挑战GPU堡垒
为了适应图形负载,RV64X引入了像素(Pixel)、纹理(Texture)和Z缓冲(Z-Buffer)等专用数据类型,并定义了针对这些类型的超越数学函数指令。尽管RV64X提供了一个极具前瞻性的愿景,其目前的开发活跃度似乎集中在参考实现和规范定义上,尚未像Vortex那样形成广泛部署的RTL代码库。这就像是一份宏伟的城市规划蓝图,虽然设计精美,但大部分建筑还未动工。原创 2025-11-20 13:09:55 · 713 阅读 · 0 评论 -
深度递归Q学习在部分可观察马尔可夫决策过程中的应用
深度强化学习近年来在复杂任务控制方面取得了巨大成功。为了解决这些问题,本文提出了深度递归Q网络(DRQN),通过在DQN的第一个全连接层替换为长短期记忆(LSTM)递归层,来增强模型的记忆能力。实验表明,DRQN虽然每个时间步只能看到单帧画面,但能够成功地整合时间序列信息,在标准Atari游戏和部分可观察的等价版本(如闪烁的游戏画面)上都能达到与DQN相当的性能。原创 2024-07-13 12:14:43 · 1041 阅读 · 0 评论 -
Gemini CLI 配置系统深度解析:从隐私保护到多层配置的完整架构
在深入探索了Gemini CLI的核心引擎、工具系统和扩展机制后,今天我们将聚焦于一个往往被忽视但极其重要的组件——配置系统。这个系统不仅仅是简单的参数设置,而是一个精心设计的多层配置架构¹,它包含了从隐私保护到用户体验优化的全方位考虑。注解1 - 多层配置架构:Gemini CLI的配置系统采用了5层配置优先级机制,从默认值到命令行参数,每一层都有其特定的用途和优先级。这种设计让用户可以在不同层次设置不同的配置,既保证了灵活性,又确保了配置的一致性。Gemini CLI的配置系统展现了现代软件配置管理的。原创 2025-07-05 06:37:14 · 763 阅读 · 0 评论 -
矩阵的隐秘折叠:当数据分析师重写高斯消元的三千年法则
是ACM竞赛中的标准答案,还是人类理解数学的叙事方式?李然的答案是后者。当消元过程被重新讲述为秩1矩阵的"诞生与消亡",当冰冷的浮点运算被赋予"折叠"的诗意,算法不再是机械步骤的堆砌,而成为。原创 2025-11-22 00:00:00 · 381 阅读 · 0 评论 -
降噪的奥德赛:当Transformer穿越噪声迷宫,在像素海洋中寻找纯净的灯塔
同样地,所有人脸图像构成了一个低维流形:无论你换发型、变老、做鬼脸,你的核心面部特征在这个流形上的相对位置是稳定的。然而,令人意外的是,这位“大师”并没有直接修复你的照片,而是开始分析噪点的纹理、统计噪点的分布、预测下一颗噪点可能出现的精确位置。目前的研究热点,比如更复杂的噪声调度(cosine schedule、log-normal schedule)、更精巧的tokenizer设计(VQ-GAN、建议编码器)、多阶段训练策略(先训练tokenizer,再训练扩散模型,最后联合微调),都可能变得。原创 2025-11-22 23:30:41 · 34 阅读 · 0 评论 -
“Pig-meat”式造词法:中式英语对英语词汇困境的解构与重构
Pig-meat”式造词法是中式英语(Chinglish)中一种极具代表性的词汇构建现象,其核心特征在于将中文的构词逻辑直接迁移至英语,形成一种独特的、具有高度透明性和分析性的新词。这一命名源自对中文词汇“猪肉”的逐字直译:“猪”(pig)与“肉”(meat)的组合。在标准英语中,这一概念对应的是“pork”,一个源自法语“porc”的词汇,其词源与形态结构对于英语学习者而言并不直观,需要单独记忆。原创 2025-11-22 21:37:05 · 144 阅读 · 0 评论 -
AI 驱动自动交易智能体:TradingAgents-CN
TradingAgents-CN 是一个基于的金融分析框架。其核心思想是将复杂的金融交易决策过程拆解为多个独立的专业职能,由不同的 AI 智能体(Agents)分别承担。原创 2025-11-21 07:51:36 · 118 阅读 · 0 评论 -
TradingAgents-CN 架构深度解析报告
TradingAgents-CN 是一个基于的金融分析框架。其核心思想是将复杂的金融交易决策过程拆解为多个独立的专业职能,由不同的 AI 智能体(Agents)分别承担。原创 2025-11-21 07:36:44 · 22 阅读 · 0 评论 -
当语言挣脱字母的枷锁:一场通往连续思维空间的奥德赛
这是一篇关于语言模型底层范式革命的深度解析。我们将跟随腾讯微信AI团队的研究者,探索他们如何打破离散符号的桎梏,让AI在连续的语义海洋中自由航行。这不是简单的技术迭代,而是一场关于"思维带宽"的哲学思辨。原创 2025-11-20 20:04:14 · 33 阅读 · 0 评论 -
当代码学会“即兴演出“:揭秘对话式AI的“剧本革命“
想象一下,你正站在一场没有剧本的戏剧后台。演员们需要即兴发挥,却要在复杂的规则框架下完成一出精确到分秒的商业演出。这不是先锋剧场,而是今天大多数企业对话系统的真实写照——在灵活性与精确性之间走钢丝,在自然对话与业务规范之间寻找不可能的平衡点。这便是框架的诞生时刻,一场正在重塑人机协作范式的静默革命。它不再是让程序员用晦涩代码编写对话逻辑,而是让领域专家用日常语言撰写"业务剧本",让大语言模型(LLM)成为能够自主理解、执行甚至即兴发挥的"数字演员"。原创 2025-11-20 21:15:00 · 38 阅读 · 0 评论 -
当代码学会“即兴演出“:揭秘对话式AI的“剧本革命“
想象一下,你正站在一场没有剧本的戏剧后台。演员们需要即兴发挥,却要在复杂的规则框架下完成一出精确到分秒的商业演出。这不是先锋剧场,而是今天大多数企业对话系统的真实写照——在灵活性与精确性之间走钢丝,在自然对话与业务规范之间寻找不可能的平衡点。这便是**Conversation Routines(对话例程)**框架的诞生时刻,一场正在重塑人机协作范式的静默革命。原创 2025-11-21 00:00:00 · 19 阅读 · 0 评论 -
观测者中心论:深度解析“复杂性即优势”(CAA)框架
“复杂性即优势”(Complexity-as-Advantage, CAA)框架的核心思想在于,它摒弃了将复杂性视为系统内在、绝对属性的传统观念,转而将其定义为一个相对的、操作性的概念,即复杂性源于不同能力观测者在预测系统行为时所表现出的性能差异 。该框架的出发点是,一个系统的复杂性并非由其熵值或算法复杂度等静态指标唯一决定,而是体现在“更强的观测者能够持续地、显著地超越较弱的观测者”这一事实上。这种性能差异,通常以决策理论中的“后悔值”(Regret)来衡量,构成了CAA框架的基石。具体而言,CAA将复杂原创 2025-11-22 00:00:00 · 13 阅读 · 0 评论 -
当AI学会“习惯成自然“:解码AutoTool如何让智能体摆脱“选择困难症“
AutoTool的故事,本质上是一个关于。原创 2025-11-19 23:07:25 · 1430 阅读 · 0 评论 -
Agno记忆系统深度研究:架构、机制与未来展望
Agno作为一个新兴的高性能多智能体(Multi-Agent)系统框架,其记忆系统的设计充分体现了其在性能、可扩展性和易用性方面的核心追求。该记忆系统并非一个孤立的模块,而是深度集成于Agno的代理(Agent)抽象、知识库(Knowledge Base)和运行时(AgentOS)之中,旨在为智能体提供跨越单次会话的持久化上下文能力,从而实现真正的个性化和长期学习。其架构设计巧妙地平衡了功能的丰富性与系统的轻量化,通过模块化的存储后端、灵活的记忆管理策略以及清晰的API接口,为开发者构建复杂的、具备长期记忆原创 2025-11-20 00:06:46 · 149 阅读 · 0 评论 -
Agno记忆系统深度研究:架构、机制与未来展望
Agno作为一个新兴的高性能多智能体(Multi-Agent)系统框架,其记忆系统的设计充分体现了其在性能、可扩展性和易用性方面的核心追求。该记忆系统并非一个孤立的模块,而是深度集成于Agno的代理(Agent)抽象、知识库(Knowledge Base)和运行时(AgentOS)之中,旨在为智能体提供跨越单次会话的持久化上下文能力,从而实现真正的个性化和长期学习。其架构设计巧妙地平衡了功能的丰富性与系统的轻量化,通过模块化的存储后端、灵活的记忆管理策略以及清晰的API接口,为开发者构建复杂的、具备长期记忆原创 2025-11-20 06:00:00 · 27 阅读 · 0 评论 -
思想的交响:当知识图谱遇见语言模型的“意识流“
作为一位严谨的科学家,我必须带领读者深入那些决定成败的技术细节。这些如同瑞士钟表内部的微小齿轮,虽不显眼,却是精准运行的关键。原创 2025-11-19 23:19:35 · 116 阅读 · 0 评论 -
当AI学会写自己的剧本:从提示工程到上下文演化的智能跃迁
想象一下,你正在和一位刚从外星来的天才对话。这位天才知道世间一切事实——从量子物理到莎士比亚,从蛋白质折叠到Python语法——但有一个问题:它完全没有。原创 2025-11-19 21:59:02 · 56 阅读 · 0 评论 -
思想的琥珀:当AI模型成为无损的时光胶囊
想象一下,你正在向一位朋友讲述一个精彩的故事。故事讲到一半,你突然担心起来:朋友的记忆会不会在转述时丢失细节? 那些精妙的转折、微妙的情感、关键的伏笔——会不会在记忆的传递中化为模糊的印象?这恰恰是人工智能研究者们长期困扰的问题。自2017年Transformer架构横空出世以来,一个阴云般的假设始终笼罩在学界上空:这些由非线性激活函数、层归一化和注意力机制构建的语言模型,本质上是在"压缩"和"丢失"信息。就像传话游戏一样,输入的文本在变成那些高维向量后,似乎注定要失去某些独特性的印记。不同的问题可能会坍缩原创 2025-11-22 00:00:00 · 16 阅读 · 0 评论 -
代码的交响乐团:当Agno遇上AgentOS,一场关于智能编排的冒险
传统框架(如LangChain、LlamaIndex)专注于"如何给大模型添加工具",而Agno思考的是"如何编排一个由大模型驱动的软件系统"。这个视角转换就像从"如何给马配上更好的马鞍"升级到"如何设计一辆汽车"。AgentOS的控制平面概念, borrowed from Kubernetes的编排哲学。正如K8s管理容器化应用,AgentOS管理"智能体化"应用。这种架构级别的抽象,让Agno天然适合企业级部署。原创 2025-11-19 08:47:08 · 34 阅读 · 0 评论 -
MAKER新型人工智能系统深度研究:MDAPs框架与“抢先领先k票”机制解析
MAKER系统,作为大规模分解代理流程(Massively Decomposed Agentic Processes, MDAPs)框架的首个实现,在人工智能领域,特别是大型语言模型(LLM)的应用上取得了里程碑式的突破。它被设计并验证为首个能够成功解决包含超过一百万个LLM步骤的复杂任务,且在整个过程中实现零错误的系统。这一成就的核心在于,它从根本上解决了长期困扰LLM应用的一个关键难题:随着任务步骤的增加,错误率的累积效应导致任务最终失败。原创 2025-11-19 00:34:54 · 25 阅读 · 0 评论 -
嵌套学习 (Nested Learning, NL):赋予AI持续学习能力的革命性范式
嵌套学习(Nested Learning, NL)的核心哲学在于彻底颠覆传统深度学习中将模型架构(Architecture)与优化算法(Optimization)视为两个独立组件的“扁平化”视角 。传统方法通常将神经网络的结构设计和其训练过程分离开来,模型架构是预先定义好的静态蓝图,而优化算法(如SGD、Adam)则是一个外部的、统一的规则引擎,负责在训练期间调整模型参数 。这种分离的视角隐藏了模型内部不同组件之间复杂的梯度流和动态更新过程,将整个学习系统视为一个单一层次的优化问题。然而,嵌套学习范式提出,原创 2025-11-19 00:17:56 · 58 阅读 · 0 评论 -
当上下文学会自我进化:OpenCE与闭环思维的智能革命
OpenCE 的故事,是关于。原创 2025-11-22 00:00:00 · 14 阅读 · 0 评论 -
OpenCE的永恒轮回:当上下文从单向街道变身无限循环的宇宙飞船
想象你减肥:开环是今天称体重→明天继续乱吃;闭环是每次吃完立刻记录热量、看到超标立刻调整第二天的菜单。久而久之,你的饮食习惯自动优化。OpenCE把这个人类最强大的学习机制,完整移植给了AI系统。🔥。原创 2025-11-21 00:00:00 · 20 阅读 · 0 评论 -
上下文的觉醒:当提示词从僵尸变身永生凤凰的惊天逆袭
传统上下文像一张静态照片,死板不变。而活体剧本则像一部互动电影,每一轮交互都添加新镜头、剪辑旧错误,还能自动避免重复。它通过生物般的生长机制,确保知识积累永不丢失,而是层层叠加、精炼提升。这不仅仅是技术升级,更是哲学层面的跃迁——从机械决定论到进化论的华丽转身。基于这个洞见,我们可以进一步展开:为什么说这是“无监督自改进”?因为整个过程只靠代码执行的成功/失败信号,不需要人类宝贝一样的手动标签。系统自己从战场上爬起来,舔舐伤口,然后变得更强。原创 2025-11-20 00:00:00 · 29 阅读 · 0 评论 -
因果之箭的隐秘舞蹈:γ-Covering如何悄然重塑大型语言模型的灵魂世界
想象一下,你正站在一个无边无际的数字宇宙边缘,手里握着一把因果之箭。这把箭不是随便射出去的——它只向前飞行,绝不回头。而2025年的今天,这把箭终于找到了最完美的弓:Directed Information γ-Covering。它不再是粗暴地把上下文砍成碎片,而是像一位优雅的园林大师,用最少的枝叶,修剪出最繁茂的因果之树,让LLM在千军万马般的token洪流中,依然能精准命中那颗“意义之心”。原创 2025-11-18 21:00:00 · 69 阅读 · 0 评论 -
3DReasonKnee与EGO-Prompt:AI在医学影像中的“接地气推理”与知识协同进化
传统的知识增强方法通常依赖于一个预先构建好的、静态的知识图谱或规则库,AI模型在推理时被动地查询和使用这些知识。然而,这些静态知识库往往是不完整的,甚至可能存在错误。EGO-Prompt框架颠覆了这一模式,它从一个由人类专家构建的、允许存在缺陷的初始知识图谱(称为语义因果图,SCG)开始。随后,框架通过一个进化优化算法,利用真实数据中的模式,主动地、持续地精炼和修正这个SCG。在这个过程中,AI模型不仅是知识的使用者,更是知识的验证者和改进者。原创 2025-11-19 00:00:00 · 25 阅读 · 0 评论 -
上下文的上下文:一场从石器到星舰的AI认知革命
想象一下,你正站在一个古老的洞穴壁画前,那些原始人类用粗糙的线条描绘猎物和星辰,那便是最早的“上下文”——他们试图用有限的符号,捕捉无限的世界本质。读完它,你会发现,我们以往所有对AI的“调教”——那些精心雕琢的提示词、堆积如山的RAG检索、摇摇欲坠的工具调用——不过是石器时代的斧头,而真正的星际时代,已经悄然拉开帷幕。相反,如果AI能记住你上周刚从罗马度假回来,它会直接推荐一家正宗的披萨店,还附上“考虑到你喜欢辣椒油的口味”——这,就是上下文工程的魔力。你心情低落,AI不需你说,就知道递上杯热巧克力。原创 2025-11-19 00:00:00 · 136 阅读 · 0 评论 -
上下文的觉醒:当AI开始反过来给我们建模的那一天
做成三明治结构,性价比直接起飞。但论文更狠的是提出“自烘焙(Self-Baking)”概念——让AI自己决定什么时候该总结、什么时候该丢弃、什么时候该重写。这不就是人类大脑的海马体机制吗?白天发生的事,晚上睡觉时AI偷偷帮你“烘焙”成长期记忆。你醒来时,它已经把昨天的混乱对话,炼成了一张干净的思维导图。这才是真正的数字遗忘与记忆艺术。原创 2025-11-19 00:00:00 · 218 阅读 · 0 评论 -
AI的文艺复兴:当生命科学迎来六把“思想手术刀”
回顾这六把“思想手术刀”,我们看到了一条清晰的进化路径:从基础的指令(原创 2025-11-19 00:00:00 · 257 阅读 · 0 评论 -
提示工程的黄昏:当AI学会“禁止自己乱想”时
下次当你准备给模型塞第37条“请保持客观”“请考虑反例”“请用第一性原理”时,请先问自己一个残酷的问题:我是在帮助它,还是在干扰它?也许,真正的SOTA提示,只需要四句话:你是一个纯数学推理引擎。你只能使用问题中明确给出的信息。你被禁止引入任何外部知识。现在,思考。一步一步。然后,看着它自己,雕琢出完美答案。原创 2025-11-18 20:00:00 · 27 阅读 · 0 评论 -
AI的自我觉醒:当提示工程师失业,上下文建筑师上位时,2025年11月的惊人转折
2025年10月25日那篇《You Don’t Need Prompt Engineering Anymore》就像一颗核弹,作者直接宣布“提示工程已死”。他们推出的Sculpting技术,像一个冷酷的外科医生,等模型吐出一大段推理后,再拿着激光刀对每个token动手术:这个词多余,删!这个逻辑弱化,重写!这个歧义,强化!实验数据狠得让人沉默:在数学基准GSM8K上,Sculpting让一个普通模型从88%准确率干到94%以上,几乎追平了需要海量强化学习的o1系列。更绝的是,它只用了原计算量的三分之一。原创 2025-11-18 20:00:00 · 167 阅读 · 0 评论 -
基于 Graph 的通用推荐系统设计
找到行为相似的用户,推荐他们加入的服务器。: 在同一服务器活跃的用户可能有共同兴趣。: 你的好友加入的服务器可能符合你的兴趣。: 社交距离近(2-3跳)的用户可能认识。: 计算两个用户加入服务器集合的相似度。: 推荐用户可能感兴趣的服务器/社区。: 你的好友的好友可能是你认识的人。: 成员多且活跃的服务器更值得推荐。: 推荐近期消息多、参与者多的频道。: 在服务器内推荐活跃或相关频道。: 推荐该服务器的相似用户数量。: Jaccard 系数 =: 为用户推荐可能认识的人。: 加入该服务器的好友数量。原创 2025-11-18 20:00:00 · 24 阅读 · 0 评论 -
在逆向问题的迷雾中寻找答案:重采样算法的崛起
在现代科学技术的快速发展中,图像处理和逆向问题的解决方案正逐渐成为一个炙手可热的研究领域。对于那些不熟悉这一领域的读者来说,逆向问题的核心在于通过观测数据重建未知信号。例如,在医学成像中,我们的目标是从一组扫描得到的模糊或噪声图像中恢复出清晰的图像。这听起来似乎简单,但实际上却充满了挑战,因为这些问题通常是“病态”的,即缺乏足够的信息来唯一地确定解决方案。原创 2024-08-19 08:00:00 · 1017 阅读 · 0 评论 -
在边缘计算中优化大语言模型的协同推理:Mixture-of-Edge-Experts (MoE²) 的实现与应用
MoE²框架的核心理念是利用边缘设备上不同LLM专家的异构能力,通过动态选择专家来处理各种任务。门控网络和两级专家选择机制。在这种机制下,系统能够根据用户的请求动态选择最合适的LLM专家,从而实现高效的推理。原创 2025-01-19 21:15:23 · 1088 阅读 · 0 评论
分享