潜语义分析在问卷回复评估及动态关系网络模式挖掘中的应用
1. 潜语义分析在问卷回复评估中的应用
在驾驶场景相关的问卷回复评估中,潜语义分析(LSA)发挥了重要作用。
1.1 背景空间构建
为了实现对问卷回复的有效评估,需要构建一个合适的背景空间。这个背景空间要能代表通用英语语言的使用情况,同时也要充分体现驾驶特定语言以及针对青少年群体的语言使用特点,因为青少年是驾驶场景问题的主要受众。
构建背景空间的具体内容如下:
|内容类型|数量|来源|作用|
| ---- | ---- | ---- | ---- |
|通用语言文档|100,000 篇|从 RTRC 语料库随机选取|提供语言使用的基础|
|驾驶主题文档|6,629 篇|多个网站收集|涵盖州执照指导手册、驾驶员培训材料和驾驶相关文章|
|青少年撰写文章|5,056 篇|网络高中报纸|完善目标受众的词汇|
|场景回复项|942 项|初始数据收集|初始训练和测试后纳入内容集|
最终用于构建背景空间(BIS)的内容集包含 112,627 篇文档,其中有 185,730 个独特术语。
1.2 确定目标和反馈项
- 人类输入(SME)
- 两名人类评分员审查所有回复,识别安全和不安全回复中最常用的策略,以此建立评分标准。
- 回复按 4 分制手动评分,4 分代表最佳或“最安全”回复。
- 计算每个分数组回复项的投影向量的质心向量,验证各分数组在语义空间中是否分离。
潜语义分析在问卷与动态网络中的应用
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



