迈向生态研究的智能闭环工作流
1. 系统架构与数据传输
在生态实验研究中,存在支持多花园实验的系统。实时数据中心(RTDC)提供一系列服务,涵盖实时数据处理、驱动命令生成、数据验证与质量保证、流式数据可视化以及性能监控等,以支持实验和相关操作。
流式数据中间件连接着花园服务器和 RTDC,它提供网络抽象功能,通过流命名、发布/订阅语义和本地持久存储等服务,隐藏底层网络层。SEGA 项目采用用 Java 编写的开源中间件包 DataTurbine 来实现花园服务器和 RTDC 之间的数据流式传输。
DataTurbine 对 TCP/IP 连接进行抽象,使得流可以在不同位置的 Java 程序之间路由。数据可以通过名为 Source/Sink 的客户端程序,借助 DataTurbine API 调用其方法,插入或提取到 DataTurbine 环形缓冲网络总线(RBNB)的任何实例中。Source/Sink 用 Java 编写,可包含实现任意数据处理的代码,包括学习、推理和决策等功能。由于它们既能产生也能消费数据流,因此这里将 DataTurbine 客户端称为处理器。
每个花园服务器执行一个处理器,收集来自花园传感器网络和中央数据记录器的传入数据包,并将其插入本地 DataTurbine 实例。RTDC 服务器上运行的处理器使用请求/响应协议获取数据并插入本地 RBNB。其他处理器进一步解析和处理原始流式数据,例如将其转换为工程单位或进行传感器故障检测。
2. 生态实验的闭环控制
基于中间件的架构和网络基础设施允许引入任意数量的模块化处理器,这些处理器能够消费和/或产生 RBNB 数据流。处理器可以组成有向图,构建实现
超级会员免费看
订阅专栏 解锁全文
1169

被折叠的 条评论
为什么被折叠?



