利用GPS轨迹和蛋白质序列信息进行身份识别与同源性检测
在当今的科技领域,利用生物特征信息进行身份识别以及探索生物分子间的关系是研究的热点。本文将介绍基于GPS轨迹的生物识别技术以及蛋白质远程同源性检测的相关内容。
基于GPS轨迹的生物识别
特征提取
在GPS轨迹生物识别中,DFT特征的提取是关键步骤。首先,对于第k个频率分量,分别用幅度和相位来表示。类似于短期语音处理,我们舍弃相位部分,仅保留幅度。接着,对保留的幅度部分取对数,然后使用离散余弦变换(DCT)进行参数化,目的是降维和去相关。我们保留前24个DCT系数(包括直流系数),并将速度和转弯角度特征进行拼接,得到维度为48的特征向量。
DFT特征用于模拟路线段中速度和转弯角度的变化频率和幅度,同时在一定程度上反映用户的速度。速度越快,转弯和加速/减速的频率越高,这会使与道路网络相关的频谱部分向右移动(向更高频率)。
例如,通过对比两位不同用户的特征可以发现,用户2在路段速度上的低频变化较少,在0.05 Hz至0.1 Hz频率之间出现低谷,而用户1在相同频率范围内则有峰值。此外,“dct + idct”表示对包含最低24个系数的零填充特征向量应用逆DCT来重建原始幅度谱,24维特征能较好地保留幅度谱的显著特征。
除了DFT特征,我们还尝试了其他类型的GPS特征,如单个点的简单速度、加速度和转弯角度特征,以及短(2 - 20点)窗口的相对速度和转弯角度。但实验表明,DFT特征性能最佳,因此本研究仅采用该特征。
高斯混合模型分类器
我们将GPS轨迹数据的用户分类视为生物认证任务,遵循贝叶斯决策理论。给定由特征向量序列表示的
超级会员免费看
订阅专栏 解锁全文
34

被折叠的 条评论
为什么被折叠?



