- 博客(6)
- 收藏
- 关注
原创 ubuntu20.04网卡驱动安装--防止自己忘记
点击plain即可下载,这是89的链接,同理可以找到59.测试59可以89不行,其他未知。解压压缩包后 将其中的 iwlwifi-ty-a0-gf-a0-59.ucode。在backport-iwlwifi下新建一个文件夹。复制到这个新文件夹中。
2025-11-29 22:31:15
361
1
原创 Hello-agent task2 --笔记
以下内容均来自Hello-agent(Data Whale)第三章 大语言模型基础语言模型(language model)是自然语言处理的核心,根本任务是计算一个词序列出现的概率。在深度学习兴起之前,统计方法是语言模型的主流。其核心思想是,一个句子出现的概率,等于该句子中每个词出现的条件概率的连乘。词用wi表示难以直接计算,故引入马尔可夫假设。核心思想:不必回溯一个词的全部历史,而是认为一个词出现概率只与它前面有限的n-1个词有关。基于这个假设建立的语言模型,我们称之为 N-gram模型。
2025-11-12 22:23:26
839
原创 Hello-agent task1 --随笔(记录自己感兴趣的点)
更可能的不是“一刀切取代”,而是“在预训练这个地基上,往上叠更灵活的适配和外部知识接入”。在很多任务中(围棋、机器人控制、游戏、调度),你“现在做的动作”会直接影响“你之后能看到的状态”,也会影响你最终能不能拿到奖励。:把感知/理解交给模型,把安全/合规交给规则,把实时知识交给检索,这样能最大限度延续 MYCIN 想要的“专业+可解释”,又避开它的知识获取瓶颈。模型的语言理解、知识和基本生成能力,主要是靠大规模预训练(自监督的下一词预测)和后续的有监督微调学到的,这部分不是 RL 的主战场。
2025-11-10 18:37:53
681
原创 ThinkGrasp:用于杂乱场景下策略性部件抓取的视觉-语言系统->LLM-VLM-抓取策略的逐步结合
其中,ot 是被选中的目标物体(包含其颜色和名称),g 是语言指令,Otc 是当前场景的彩色观测,fselect 表示选择函数,用来在给定指令和场景的条件下评估每个物体 o 的适配程度。也就是说,它不仅能识别“这是一个杯子”,还可以识别“这是杯子的把手”“这是椅子的靠背”“这是车门”这种。即使 GPT-4o 第一拍选的并不是最终真正要的 “mango”,LangSAM 的分割和后面的打分过程仍然可以利用明显的颜色/区域特征,把目标锁定到正确的物体上,逐步逼近用户真正的目标;)下提升系统的抓取能力。
2025-11-07 01:03:43
1086
原创 G-Memory: Tracing Hierarchical Memory forMulti-Agent Systems --了解目前agent研究方向
类似于人类社会协作所产生的集体智能[22, 23, 24],MAS 通过组织多个智能体[25, 26, 27],无论是协同合作[28, 29, 30, 31]还是对抗竞争[32, 33, 34],都能够超越单一智能体在认知深度与专业性上的局限。其中:ri(t) 表示由智能体 Ci 生成的响应(可能包含推理步骤、中间分析或最终建议),Psys(t) 为该轮的全局指令集(其中也包含各智能体的角色设定 Ri),N−(Ci) 为 Ci 的入邻居集合,其输出将作为本智能体的上下文输入。
2025-11-07 00:31:30
1300
原创 A knowledge-driven framework for Robotic Odor Source Localization usinglarge language models 阅读随记
所以,最准确的说法是:**它不是只靠你手工写几条,也不是只靠在线日志,而是把“能描述当前场景的自然语言 + 当时LLM的推理和动作”都当成经验存起来,供后面检索。机器人在生成动作时,不是只看当前传感器数值,还会从LLM那一侧得到“往哪边走更可能靠近源头”的指引——也就是利用场景描述 + 从记忆里取回的few-shot经验,让LLM给出更明确的“选逆风还是横风”的导航建议。通过将 LLM 的语义理解与决策能力,与传统 OSL 方法的传感数据相结合,机器人有望在探测与朝向气味源导航方面实现更高的准确性与效率。
2025-11-05 19:24:37
645
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅