手势输入与GPS轨迹生物识别技术解析
1. 阈值聚类与数据集
在处理阈值时,采用随机交换(RS)算法对阈值进行聚类。该算法进行10,000次迭代,聚类数量为16个。它在K - Means和质心随机重定位之间交替进行,以避免陷入局部最优。通常,算法在几百次迭代后就会收敛到最终结果,但由于该算法速度较快,使用10,000次迭代能提高找到最优分区的概率。从聚类结果中,选取具有最高相似度路线的聚类。
使用Mopsi20145数据集进行实验,它是截至2014年底从Mopsi数据库收集的所有路线的子集。该数据集包含6,779条路线,由51位拥有10条以上路线的用户记录。这些路线涵盖了步行、骑行、徒步、慢跑、定向运动、滑雪、驾驶、乘坐公交、火车或船只等多种活动。大部分路线位于芬兰约恩苏地区,形成了一个非常适合测试该方法的密集区域。数据集的统计信息如下表所示:
| 类别 | 数量 |
| ---- | ---- |
| 路线 | 6,779 |
| 点 | 7,850,387 |
| 公里数 | 87,851 |
| 小时数 | 4,504 |
实验在Dell R920,4 x E7 - 4860(共48核),1 TB内存,4 TB SAS硬盘的设备上进行。
2. 搜索效率分析
搜索效率与数据库大小和网格分辨率成正比。网格的选择取决于在地图上查看目标路线所需的缩放级别,小路线适合使用较高的缩放级别查看。同时,网格也依赖于屏幕大小。为了更好地理解这一点,计算了Mopsi2014数据集中每条路线的最佳查看缩放级别,即能在屏幕上显示整个路线的最大缩放级别。结果显示,最低缩放级别很少使用,因为处于该缩
超级会员免费看
订阅专栏 解锁全文
1237

被折叠的 条评论
为什么被折叠?



