基于自由文本击键动态的用户认证技术解析
1. 击键序列长度
击键动态认证可根据击键序列的长度和一致性分为四类。对于自由文本击键数据集,每个用户的数据包含数千字符的长击键序列。以往研究会将长序列拆分为多个子序列,这里也采用相同做法,每个子序列被视为对应用户的独立击键序列。
短击键子序列会降低认证准确性,而长击键子序列可能引入更多噪声。因此,需要对不同长度的击键子序列进行实验,以确定最优值。
2. 击键动态图像
将整个击键序列划分为多个子序列后,对于长度为 N 的子序列,可从连续击键对中确定 6(N - 1) 个特征,重复对取平均值并视为单个对。例如,长度为 50 的子序列最多可获得 6 × 49 = 294 个特征。
为更好地组织这些特征,提出了一种新的特征工程结构。将 UD - time、DD - time、DU - time 和 UU - time 这四个由连续击键事件确定的特征组织成一个四通道的转移矩阵,类似于 RGB 图像的三通道结构,这里的四通道可看作四个 N × N 矩阵叠加。矩阵的每行和每列对应键盘上的一个键,每个通道对应一种特征。
最后一个特征是持续时间,将其组织成对角矩阵并作为第五个通道添加到转移矩阵中。若一个键或键对被多次按下,使用其平均值作为该键或键对的持续时间,此通道中只有对角位置有值。最终,击键子序列生成的所有特征都嵌入到一个五通道的转移矩阵中,即击键动态图像(KDI)。
为防止转移矩阵过于稀疏,仅考虑 42 个最常用击键的时间特征,这 42 个键包括 26 个英文字母(A - Z)、10 个阿拉伯数字(0 - 9)和 6 个元键(空格、退格、左 Shift、右 Shift
超级会员免费看
订阅专栏 解锁全文
5万+

被折叠的 条评论
为什么被折叠?



