基于众包的口语对话数据收集框架:Pair Me Up的研究与实践
1. 延迟测量协议与数据同步
在实验室环境中,可通过高速局域网连接来最小化机器间的网络延迟,并使用网络时间协议(NTP)等方法同步计算机时钟。然而,在众包数据收集场景下,网络延迟更高且更难控制,同时出于安全考虑,不能调整远程用户的系统时钟。
在基于网络的游戏界面中,延迟可能会以多种方式影响所收集的数据。例如,远程用户在其用户界面(UI)发起操作到服务器得知该操作发生之间可能存在延迟;反之,服务器在用户UI中发起事件(如更改图像集),该事件可能要过一段时间才会在用户UI中实际发生。
为解决这些问题,我们实现了一个简单的延迟测量和同步协议,该协议可以:
1. 估计每个客户端与服务器之间的网络延迟。
2. 转换从客户端机器系统时钟收集的时间戳和服务器上的时间戳。
该协议的工作流程如下:
- 在游戏的每个图像集开始时,服务器S向远程客户端C发送一个请求数据包。服务器发送请求时的时间戳记为$t_a^S$。
- 客户端C接收到请求后,运行在客户端C浏览器中的代码计算客户端系统时间戳$t_c^C$,并立即将该值随响应一起发送回服务器。
- 服务器在$t_d^S$时刻接收到响应。
每个请求/响应周期,服务器可得到服务器 - 客户端通信的往返延迟:$roundtrip = t_d^S - t_a^S$。为了关联客户端事件时间戳和服务器事件时间戳,我们假设客户端在服务器观察到的往返时间的中点发起响应,即$t_c^S = \frac{1}{2}(t_a^S + t_d^S)$。
通过这种方式,我们得到一系列时间戳对$t_c^C$
超级会员免费看
订阅专栏 解锁全文
7255

被折叠的 条评论
为什么被折叠?



