StreetLearn 项目推荐
项目基础介绍和主要编程语言
StreetLearn 是一个由 Google DeepMind 开发的开源项目,主要用于在真实世界的街道环境中训练导航代理。该项目结合了 C++ 和 Python 两种编程语言,提供了高效的引擎实现和灵活的 Python 接口。
项目核心功能
StreetLearn 的核心功能包括:
-
StreetLearn 引擎:使用 C++ 实现,负责加载、缓存和提供 Google Street View 全景图像,并通过投影将其转换为第一人称视角。引擎还处理导航功能,根据城市街道图和当前方向移动代理。
-
Python 环境接口:提供了一个 Python 接口,允许用户自定义动作空间,并通过该接口调用 StreetLearn 环境。该接口支持多种游戏定义,用户可以根据需求选择不同的游戏模式。
-
TensorFlow 实现:项目还包括 TensorFlow 实现的导航代理,这些代理基于“Importance Weighted Actor-Learner Architectures”(IMPALA)架构,能够高效地学习和执行导航任务。
项目最近更新的功能
StreetLearn 项目最近更新的功能包括:
-
BatchedStreetLearn 接口:新增了一个批处理接口,允许用户同时实例化多个 StreetLearn 环境,这些环境共享相同的动作规范、观察规范和全景缓存,并以批处理格式返回观察结果。
-
Oracle 代理:新增了 Oracle 代理和指令跟随 Oracle 代理,这些代理能够自动导航到目标位置或通过路径点跟随指令,并报告在这些任务上的 Oracle 性能。
-
交互式人类代理:改进了交互式人类代理,使其能够支持更多游戏模式,并提供更友好的用户界面。
通过这些更新,StreetLearn 项目不仅增强了其功能性和灵活性,还提升了用户体验和开发效率。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考