自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 ubuntu20.04网卡驱动安装--防止自己忘记

点击plain即可下载,这是89的链接,同理可以找到59.测试59可以89不行,其他未知。解压压缩包后 将其中的 iwlwifi-ty-a0-gf-a0-59.ucode。在backport-iwlwifi下新建一个文件夹。复制到这个新文件夹中。

2025-11-29 22:31:15 361 1

原创 Hello-agent task2 --笔记

以下内容均来自Hello-agent(Data Whale)第三章 大语言模型基础语言模型(language model)是自然语言处理的核心,根本任务是计算一个词序列出现的概率。在深度学习兴起之前,统计方法是语言模型的主流。其核心思想是,一个句子出现的概率,等于该句子中每个词出现的条件概率的连乘。词用wi表示难以直接计算,故引入马尔可夫假设。核心思想:不必回溯一个词的全部历史,而是认为一个词出现概率只与它前面有限的n-1个词有关。基于这个假设建立的语言模型,我们称之为 N-gram模型。

2025-11-12 22:23:26 839

原创 Hello-agent task1 --随笔(记录自己感兴趣的点)

更可能的不是“一刀切取代”,而是“在预训练这个地基上,往上叠更灵活的适配和外部知识接入”。在很多任务中(围棋、机器人控制、游戏、调度),你“现在做的动作”会直接影响“你之后能看到的状态”,也会影响你最终能不能拿到奖励。:把感知/理解交给模型,把安全/合规交给规则,把实时知识交给检索,这样能最大限度延续 MYCIN 想要的“专业+可解释”,又避开它的知识获取瓶颈。模型的语言理解、知识和基本生成能力,主要是靠大规模预训练(自监督的下一词预测)和后续的有监督微调学到的,这部分不是 RL 的主战场。

2025-11-10 18:37:53 681

原创 ThinkGrasp:用于杂乱场景下策略性部件抓取的视觉-语言系统->LLM-VLM-抓取策略的逐步结合

其中,ot​ 是被选中的目标物体(包含其颜色和名称),g 是语言指令,Otc​ 是当前场景的彩色观测,fselect​ 表示选择函数,用来在给定指令和场景的条件下评估每个物体 o 的适配程度。也就是说,它不仅能识别“这是一个杯子”,还可以识别“这是杯子的把手”“这是椅子的靠背”“这是车门”这种。即使 GPT-4o 第一拍选的并不是最终真正要的 “mango”,LangSAM 的分割和后面的打分过程仍然可以利用明显的颜色/区域特征,把目标锁定到正确的物体上,逐步逼近用户真正的目标;)下提升系统的抓取能力。

2025-11-07 01:03:43 1086

原创 G-Memory: Tracing Hierarchical Memory forMulti-Agent Systems --了解目前agent研究方向

类似于人类社会协作所产生的集体智能[22, 23, 24],MAS 通过组织多个智能体[25, 26, 27],无论是协同合作[28, 29, 30, 31]还是对抗竞争[32, 33, 34],都能够超越单一智能体在认知深度与专业性上的局限。其中:ri(t)​ 表示由智能体 Ci​ 生成的响应(可能包含推理步骤、中间分析或最终建议),Psys(t)​ 为该轮的全局指令集(其中也包含各智能体的角色设定 Ri​),N−(Ci​) 为 Ci​ 的入邻居集合,其输出将作为本智能体的上下文输入。

2025-11-07 00:31:30 1300

原创 A knowledge-driven framework for Robotic Odor Source Localization usinglarge language models 阅读随记

所以,最准确的说法是:**它不是只靠你手工写几条,也不是只靠在线日志,而是把“能描述当前场景的自然语言 + 当时LLM的推理和动作”都当成经验存起来,供后面检索。机器人在生成动作时,不是只看当前传感器数值,还会从LLM那一侧得到“往哪边走更可能靠近源头”的指引——也就是利用场景描述 + 从记忆里取回的few-shot经验,让LLM给出更明确的“选逆风还是横风”的导航建议。通过将 LLM 的语义理解与决策能力,与传统 OSL 方法的传感数据相结合,机器人有望在探测与朝向气味源导航方面实现更高的准确性与效率。

2025-11-05 19:24:37 645 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除