- 博客(17)
- 收藏
- 关注
原创 【论文阅读|2019】The Neuro-Symbolic Concept Learner: Interpreting Scenes, Words, and Sentences From Natura
神经符号概念学习机(NS-CL),该模型学习视觉概念、单词和句子的语义解析,而不需要对其中任何一个进行明确的监督;作者的模型通过简单看图像和阅读成对的问题和答案来学习。其模型构建了一个基于对象的场景表示,将句子翻译成可执行的、符号化的程序。使用一个神经符号推理模块来连接两个模块的学习。类比于人类的概念学习,感知模块基于所指对象的语言描述来学习视觉概念。同时,学习到的视觉概念有助于学习新单词和解析新句子。用课程学习来引导对图像和语言的大构成空间的搜素。
2025-12-03 22:48:28
668
1
原创 【论文阅读|2025】ARC Is a Vision Problem!
ARC(Abstraction and Reasoning Corpus)被设计以促进抽象推理的研究,而抽象推理是人类智能的一方面,常用的ARC方法是将其视为一个面向语言的问题,通过LLMs或者递归推理模型。但是尽管ARC中的拼图任务本质上是视觉的,但是目前的研究很少以视觉为中心来处理这个问题,在这项工作中,作者在视觉范式中建立了ARC,并将其框架作为图像到图像的翻译任务。为了合并视觉先验,作者把输入放在一个“画布”上,以至于可以像自然图像一样处理。
2025-11-29 21:43:07
1022
原创 【论文阅读||2025|下】Aligning generalization between humans and machines
最后总结这篇论文,以下是我总结的思考为什么要实现人与AI的泛化能力对齐?如果不对齐有多大影响?A:从自动驾驶的方向入手,一个接受正常路况训练的AI,如果无法像人类一样泛化理解“孩子可能会突然跑上马路”这一常识,那么当它遇到训练数据中未曾出现的、一个皮球滚到路上的情况时,它可能不会像人类司机一样预见到风险而提前减速,从而酿成事故。可见泛化的对齐是保证AI可信任的前提。
2025-11-25 17:19:25
569
原创 【论文阅读||2025|中】Aligning generalization between humans and machines
类似于决策树以符号化的方式规定一套规则(大量的是否确定规则)——符号AI。
2025-11-24 20:34:38
1024
原创 【论文阅读||2025|上】Aligning generalization between humans and machines
本文探讨人机协作中泛化方式的对齐问题。研究发现人类和AI的泛化机制存在本质差异:人类基于抽象概念和因果推理实现稳定泛化,而AI主要依赖数据统计相关性。作者从概念、方法和评估三个维度分析这些差异,指出当前AI的局限性在于缺乏语义理解和因果推理能力。为解决这一问题,论文提出神经符号AI的整合框架,将神经网络的感知能力与符号系统的推理能力相结合,以实现更符合人类认知的AI系统。研究强调,有效的人机协作需要实现知识状态、信息需求和价值观三个层面的对齐,这对提升团队协作效率至关重要。
2025-11-20 20:06:22
905
原创 【文献阅读||2025|下】Controlling diverse robots by inferring Jacobian fields with deep networks
机器人是由多个“关节”或“执行器”(比如电机、气阀)控制的。我们把在某一时刻给所有这些执行器的。
2025-10-16 23:47:07
458
原创 【文献阅读||2025|上】Controlling diverse robots by inferring Jacobian fields with deep networks
视觉运动雅可比场直接将任意三维点映射到其对应的系统雅可比,通过深度学习直接从输入图像中重构雅可比场而不是在专家设计的状态表示上进行条件化,这种做法绕过了传统流程中间复杂步骤(定义状态、建立动力学模型、计算雅可比);在传统的系统雅可比描述的是抽象状态。而本文的雅可比场是物理空间中具体的3D点的运动,这样使得我们可以查询机器人身上或周围。
2025-10-15 21:21:04
789
原创 【论文阅读】Beyond a Gaussian Denoiser: Residual Learning of Deep CNN for Image Denoising
深度网络就像一条多阶段的流水线,每一层都需要处理上一层的输出,但随着网络参数在训练中不断更新,每一层输出的数据的分布(比如数值范围、均值、方差)都会剧烈变化。对于去噪来说,大的感受野有助于判断一个点是噪声还是图像本身的细节(比如,一个孤立的黑点很可能是噪声,但如果是物体边缘的一部分,那就该保留)。这不是纯粹的端到端训练。这样训练出的模型,面对未知噪声水平的图像时,无需估计噪声,就能直接去噪。图像先验简单来说就是对于一张图像的经验,他应该是怎么样的,同时根据非局部相似相(找到相似的区域一点一点模仿和填充)。
2025-09-27 21:11:21
1899
原创 【论文复现|2018】DeblurGAN: Blind Motion Deblurring Using Conditional Adversarial Networks
对DeblurGAN论文项目进行复现
2025-09-22 21:05:56
988
原创 【简单易懂论文阅读|2018】DeblurGAN: Blind Motion Deblurring Using Conditional Adversarial Networks
一般的内容损失是MAE(L1)和MSE(L2),这些会为了平均而导致一些模糊,作者采用了感知损失(Perceptual loss),他本质是一个简单的L2损失,但基于基于生成的CNN特征图与目标图像的差异,也就是只关注真实图和生成图的特征差异。D(x)是判断器对真实图片的判断,我们希望越大越好,同样对于D(G(x))能越准确的判断假图片,他的值越小,那么1-D(G(x))越接近1,所以最大化D就是鼓励对真图片的高分和对假图片的低分。如果它远小于1,虽然满足约束,但限制了Critic的能力。
2025-09-21 21:17:06
1417
原创 Unity入门学习(番外篇2)
在上一次的游戏制作中,我们了解了如何使用组件和组件,并能实现碰撞的物理效果和角色的移动。大家可以搭配这两篇的内容先自行实现一下哦~Unity入门学习(四)Unity入门学习(五)
2023-11-12 13:34:17
206
1
原创 Unity入门学习(四)
}// 在第一次帧更新之前调用 Start访问级别(public)类型(int)名称(health)但是,此处添加了两个 { } 代码块,而未使用;来结束代码行。在第一个代码块中,你使用了get关键字来获取第二个代码块中的任何内容。第二个代码块就像普通函数一样,因此只需返回值。编译器完全像函数一样处理此代码行,因此你可以在 get 代码块内的函数中编写所需的任何内容(例如声明变量、执行计算和调用其他函数)。
2023-11-09 16:54:07
435
1
原创 Unity入门学习(番外篇1)
从前三篇的学习中我们对人物的移动和物理系统有了简单的了解,根据我们所学习的内容是否可以制作一个简单的小游戏呢?下面是前几期的内容,可以回去看一看噢!试试就逝世!我们要做的游戏非常简单:在一个2D平面上,玩家操控一个圆球进行上下左右移动,从而触碰到平面上一个小球,触碰到小球后游戏胜利,不过在触碰小球的过程中路上可能会有一些墙阻碍我们的移动,我们需要绕过它们然后触碰到小球。大家可以根据前面的篇章思考一下应该怎么去做?
2023-11-04 14:58:21
177
1
原创 Unity入门学习(三)
如果你已经下载了之前的素材包,那么在这里可以找到一些素材,比如说箱子。现在当我们运行游戏的时候,可以发现人物总是在箱子的前方或者后面并且不会触碰到该物体,而是直接穿过。让我们仔细思考一下,为了更加真实,应该人物站在物体前面就是人物的图层在上面,而人物在物体的后面应该是物体的图层在上面,说明是要根据角色的方位改变图层的状态。屏幕上位置较低的游戏对象(y坐标较小)应在屏幕位置较高的游戏对象(y坐标)之后显示。
2023-09-22 11:55:08
502
1
原创 unity入门学习(一)
本篇以unity官方课堂教程为参照,主要以2D游戏开发并分享自己的经验。本篇文章不会专门去写关于unity基本界面的介绍和编程语法上,而是重点在组件和应用上。Ruby's Adventure: 2D 本篇文章依据此处来说下自己的学习心得根据要求在Asset Store下载相关资源包,然后就让我们开始吧!下载好资源包后将人物角色图片拖入到Hierachy目录中,就可以发现我们的任务出现在Scene视图中了。可通过拉伸来确定合适的大小,这里就不多说明了。
2023-09-13 11:01:06
253
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅