基于频繁词距离的无载体文本信息隐藏方法
1. 无载体信息隐藏概述
信息隐藏算法一旦公开,对应的隐写分析方法就会出现。若在隐写过程中进行信息嵌入,攻击者就可能找到隐藏信息的存在甚至获取它。无载体信息隐藏是解决这一问题的有效途径,它无需对载体进行修改,就能隐藏秘密信息。其主要思想是在大数据环境中直接遍历载体,检索包含秘密信息的隐写向量(文本或图像)。
2. 方法介绍
2.1 文本数据库的准备
- 构建数据库 :从正常新闻网站获取新闻,构建自然文本数据库。
- 计算词频和排名 :对于词汇表中的每个单词,计算其出现频率,并按降序排名。
- 定义词排名映射 :文本数据库(或文本)的词排名映射定义为:
[RM = {(w_i, f_i) | i = 1, 2, 3, …, U}]
其中,$U$ 是文本数据库(或文本)中唯一单词的数量,$i$ 是单词 $w_i$ 的排名,$f_i$ 是 $w_i$ 的频率。 - 定义频繁词哈希函数 :
[H_k(t) = {h_1h_2h_3 … h_k}]
其中,$k$ 是从文本数据库词汇表中选择的前 $k$ 个频繁词的数量,$t$ 是文本数据库中的一个文本,$h_i$ 定义为:
[h_i =
\begin{cases}
1, & \text{第 } i \text{ 个频繁词出现在文本 } t \text{ 中} \
0,
超级会员免费看
订阅专栏 解锁全文
16万+

被折叠的 条评论
为什么被折叠?



