DENG_PY-优快云博客

原创 ubuntu20.04网卡驱动安装--防止自己忘记

点击plain即可下载，这是89的链接，同理可以找到59.测试59可以89不行，其他未知。解压压缩包后将其中的 iwlwifi-ty-a0-gf-a0-59.ucode。在backport-iwlwifi下新建一个文件夹。复制到这个新文件夹中。

2025-11-29 22:31:15 361 1

以下内容均来自Hello-agent(Data Whale)第三章大语言模型基础语言模型（language model）是自然语言处理的核心，根本任务是计算一个词序列出现的概率。在深度学习兴起之前，统计方法是语言模型的主流。其核心思想是，一个句子出现的概率，等于该句子中每个词出现的条件概率的连乘。词用wi表示难以直接计算，故引入马尔可夫假设。核心思想：不必回溯一个词的全部历史，而是认为一个词出现概率只与它前面有限的n-1个词有关。基于这个假设建立的语言模型，我们称之为 N-gram模型。

2025-11-12 22:23:26 839

原创 Hello-agent task1 --随笔（记录自己感兴趣的点）

更可能的不是“一刀切取代”，而是“在预训练这个地基上，往上叠更灵活的适配和外部知识接入”。在很多任务中（围棋、机器人控制、游戏、调度），你“现在做的动作”会直接影响“你之后能看到的状态”，也会影响你最终能不能拿到奖励。：把感知/理解交给模型，把安全/合规交给规则，把实时知识交给检索，这样能最大限度延续 MYCIN 想要的“专业+可解释”，又避开它的知识获取瓶颈。模型的语言理解、知识和基本生成能力，主要是靠大规模预训练（自监督的下一词预测）和后续的有监督微调学到的，这部分不是 RL 的主战场。

2025-11-10 18:37:53 681

原创 ThinkGrasp：用于杂乱场景下策略性部件抓取的视觉-语言系统-＞LLM-VLM-抓取策略的逐步结合

其中，ot 是被选中的目标物体（包含其颜色和名称），g 是语言指令，Otc 是当前场景的彩色观测，fselect 表示选择函数，用来在给定指令和场景的条件下评估每个物体 o 的适配程度。也就是说，它不仅能识别“这是一个杯子”，还可以识别“这是杯子的把手”“这是椅子的靠背”“这是车门”这种。即使 GPT-4o 第一拍选的并不是最终真正要的 “mango”，LangSAM 的分割和后面的打分过程仍然可以利用明显的颜色/区域特征，把目标锁定到正确的物体上，逐步逼近用户真正的目标；）下提升系统的抓取能力。

2025-11-07 01:03:43 1086

原创 G-Memory: Tracing Hierarchical Memory forMulti-Agent Systems --了解目前agent研究方向

类似于人类社会协作所产生的集体智能[22, 23, 24]，MAS 通过组织多个智能体[25, 26, 27]，无论是协同合作[28, 29, 30, 31]还是对抗竞争[32, 33, 34]，都能够超越单一智能体在认知深度与专业性上的局限。其中：ri(t) 表示由智能体 Ci 生成的响应（可能包含推理步骤、中间分析或最终建议），Psys(t) 为该轮的全局指令集（其中也包含各智能体的角色设定 Ri），N−(Ci) 为 Ci 的入邻居集合，其输出将作为本智能体的上下文输入。

2025-11-07 00:31:30 1300

原创 A knowledge-driven framework for Robotic Odor Source Localization usinglarge language models 阅读随记

所以，最准确的说法是：**它不是只靠你手工写几条，也不是只靠在线日志，而是把“能描述当前场景的自然语言 + 当时LLM的推理和动作”都当成经验存起来，供后面检索。机器人在生成动作时，不是只看当前传感器数值，还会从LLM那一侧得到“往哪边走更可能靠近源头”的指引——也就是利用场景描述 + 从记忆里取回的few-shot经验，让LLM给出更明确的“选逆风还是横风”的导航建议。通过将 LLM 的语义理解与决策能力，与传统 OSL 方法的传感数据相结合，机器人有望在探测与朝向气味源导航方面实现更高的准确性与效率。

2025-11-05 19:24:37 645 2

2301_79536407的博客