基于潜在语义分析的隐私保护同伴反馈及网页应用攻击研究
1. 潜在语义分析在隐私保护同伴反馈中的应用
在电子学习环境中,同伴间的反馈交流十分常见,但其中可能包含个人隐私信息。为解决这一问题,可采用潜在语义分析(LSA)技术对同伴反馈进行处理,以实现隐私保护。
1.1 关键概念及原理
- 奇异值分解(SVD) :SVD 用于从给定反馈中提取最具代表性的术语和句子。例如,对于术语 X1,通过计算其 SVD 向量与各句子 SVD 向量之间的欧几里得距离,距离最短的句子即为与该术语最相关的句子。在给定反馈中,术语 X1 对应的重要句子是第三句和第五句,分别由主题 SVD 向量 3 和 SVD 向量 4 表示。
- 潜在语义分析(LSA) :LSA 应用于同伴反馈时,可通过消除自披露句子来保护隐私。自披露句子通常不代表所有提供的反馈,因此在选择重要句子时会被隐式移除,不会包含在合成反馈中。
1.2 实验数据处理
为测试该方法,从各种英语学习论坛收集并整理了 300 条同伴反馈。具体处理步骤如下:
1. 数据预处理 :减少数据维度,排除少于三个单词的反馈,因为这些反馈过短,无法满足学习者需求。
2. 情感分析 :使用朴素贝叶斯分类器去除负面反馈,仅保留积极反馈用于后续合成步骤。
3. 反馈合成 :对积极反馈应用 LSA,排除自披露句子,生成合成反馈。
超级会员免费看
订阅专栏 解锁全文
18

被折叠的 条评论
为什么被折叠?



