基于隐马尔可夫模型的加壳器识别与疟疾预测的空间聚类方法
1. 基于隐马尔可夫模型的加壳器识别
1.1 学习任务
在加壳器识别中,使用隐马尔可夫模型(HMM)时,第二个任务是根据训练数据更新 HMM 的参数,确定转移概率矩阵 (A)、发射概率矩阵 (B) 和初始状态概率向量 (\pi)。对于每个加壳器创建一个状态,由于每个加壳器被平等对待,所以每个状态的初始概率 (\pi_i = \frac{1}{n}),其中 (n) 是加壳器的数量。每个混淆技术被视为一个观测符号。
对于对应状态 (s_i) 的加壳器 (T_{s_i}),设 (P = {P_1, P_2, \cdots, P_o}) 是由 (T_{s_i}) 加壳的训练样本列表。在状态 (s_i) 发射符号 (o_k) 的概率 (b_i(k)) 是加壳器 (T_{s_i}) 使用混淆技术 (o_k) 的频率,计算公式如下:
[b_i(k) = \frac{\sum_{j=1}^{o} f(O_k, P_j)}{\sum_{l=1}^{m} \sum_{j=1}^{o} f(O_l, P_j)}]
其中 (f(O_k, P_j)) 是混淆技术 (O_k) 在样本 (P_j) 中出现的总次数,且 (\sum_{k=1}^{m} b_i(k) = 1)。
然后为每个状态 (s_i) 生成签名向量 (V_{s_i}):
[V_{s_i} = \left{\frac{\sum_{j=1}^{o} f(O_1, P_j)}{o}, \frac{\sum_{j=1}^{o} f(O_2, P_j)}{o}, \cdots, \frac{\sum_{j=1}^{o} f(O_m, P_j)}
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



