眼下,AI 是热门中的热门,尽管它在沉浸式体验里的应用方式还有待开拓。AI 并不能解决所有问题,但它为创造下一代增强现实体验开辟了一条前所未有的捷径。
看到 AI 如此繁荣,我们也来聊聊一个增强现实(AR)避不开的概念,
“上下文”(context)
。上下文是一组描述某个
领域(domain)
的参数集,可以被编码成机器能处理的数据。“领域”可以指代任何东西,但在AR里,有三个领域最为重要:现实领域、虚拟领域和人类领域。
三大数据领域
现实领域(physical domain)
即我们所处的世界。某个地点的上下文可以包括世界坐标(即地理位置)、环境扫描数据、物体的位置、天气或周围照片——任何支持某个方案解决某个问题的现实参数。
虚拟领域(virtual domain)
包含所有与现实位置相关联的有用信息。这个定义非常宽泛,但正是 AR 的核心思想所在:AR 体验不需要复杂的 3D 资产或模型来产生价值。任何地点的元数据(描述数据的数据)都能成为一段体验的基础,比如降雨信息或某件商品在店里的位置信息。
最后,
人类领域(human domain)
是人类的具体要求,以机器能理解的形式表现出来。AI 正是在这里大显身手,自然语言处理(NLP)和生成式预训练转换器(GPT)模型在将人类表达转换为机器语言方面扮演着关键角色。人类领域也包括着机器生成内容与人的沟通方式。
关系映射是关键
生成单个领域的上下文还算比较简单。困难的地方在于不同领域间的关系:现实和虚拟坐标系统必须对齐、数字孪生必须同步现实世界的最新状态、人类描述必须能被描绘成可训练的行为,等等。
新兴技术的软硬件,包括 AI、机器人、物联网(Internet of Things),都在快速进化。在实施标准(比如互用性标准)和最佳做法出现前,有效的应用和兼容依赖于各组成部分的巧妙设计。一旦这种系统被设计出来,我们就有了一个通用基础来制作任何增强现实体验,以应用在工业、零售或普遍提高生产力上。
我们可以用一个例子来说明 AI 在跨领域映射上的能力:某个人指着远处的某个物体。很多技术都能捕捉这个现实领域的上下文,但“指”这个姿势本身并不蕴含明显的含义,不足以描述出有待解决的问题。它可能代表一个前进的方向,或询问某个物体。这个上下文如果配上语言,如“我怎么去那边?”才组成一次完整的发问。这时,AI 就可以根据人类领域上下文数据来处理现实数据,以 “理解”我们所有人每天都在不经意间进行的日常互动,并生成恰当的回应。这种“请求/回应”的透明过程可以改善所有形式的 AR 体验,最终让我们的生活更轻松。
现实实例
我们再来探索下几种不同应用里的上下文例子。AI 主要会在人类领域起作用,负责处理用户请求、预测用户需要、总结相关数据,并辅助人与设备间的交流。
实例1:房间粉刷
某位用户希望知道粉刷一块室内空间需要多少颜料。设备规格:他们有一台设备能测量该空间,还支持用语音指令询问颜料的用量。
-
现实领域:物理空间的光达扫描
-
虚拟领域:根据扫描数据现场生成的数字孪生,包含窗户、门和墙壁,可精确表示墙面区域
-
人类领域:平方面积与一罐油漆能覆盖的面积的关系
实例2:锻炼路线规划
用户想要改变日常的跑步锻炼路线。设备规格:用户的头戴设备可以确定用户的位置,带有先前的路线记录,还能投射视觉信息。
-
现实领域:用户位置、先前的跑步记录
-
虚拟领域:包含跑道和周边走道的区域地图
-
人类领域:理解跑步路线的组成以计算出新路线
实例3:机场优化
用处境意识和自动化改进机场的运营管理。用户需要“及时”(just-in-time)的弹出信息来安全地执行机场职责。设备规格:用户穿戴的腕部设备可以确定用户的地点,能与中央数字孪生建立数据连接。
-
现实领域:用户、飞机、资产和现实世界物体的位置
-
虚拟领域:可执行模拟预测、导航、兴趣点定位和地理空间处理的机场数字孪生
-
人类领域:理解任务内容、挑战、关键安全目标
实时3D空间计算方案
从上方例子中可以看到,
实时3D的价值已远不止于生成吸引人的画面,它成为了处理跨领域上下文、生成空间解决方案的引擎。
鉴于我们生活在一个三维世界里,实时3D会担任这个重要角色也就不让人意外了。
Unity作为一个核心数据引擎在游戏市场有庞大的牵引力,但在非游戏领域的应用经常被忽视。随着可穿戴设备和 AI 模型的技术不断进步,更多更棒的数据也能被捕捉,上下文的含义会前所未有的丰富,催生出更为精准的解决方案。Unity 将成为搜集这些数据的重要工具,用各色体验改善我们的工作和娱乐生活。
我们对开发者们的创作抱有很高的期待,也希望本文为大家带来了一些构建次世代体验的思路。
了解更多 AI 对沉浸式体验的推动作用,请在
这里
领略数字孪生的潜力,并且别忘了注册参加
Unity AI Beta 测试
。