生物医学知识表示与文本挖掘技术
在生物医学领域,知识的有效表示和挖掘对于推动研究进展至关重要。本文将介绍SemRep工具的批量模式、Semantic MEDLINE应用,以及自然语言处理和信息提取等相关技术。
1. SemRep工具的批量模式
SemRep的批量模式与交互模式基本相似,但需要上传文件作为请求输入,完成任务后会通过电子邮件通知用户。以下是使用SemRep批量模式的具体步骤:
1. 准备输入文件 :输入文件的每一行代表一条记录,以记录ID和文本开头,两者用“|”符号分隔。可以使用CiteSpace将Web of Science格式的书目记录转换为SemRep请求格式,路径为Data> Import/Export菜单,选择WoS标签,点击重新格式化文件的按钮。
2. 上传文件 :准备好输入文件后,逐个上传到SemRep,并提供完整的电子邮件地址以接收任务完成通知。
3. 选择模型 :SemRep有MetaMap的严格模型和宽松模型两种选项。严格模型是宽松模型的子集,宽松模型包含更多UMLS概念。为了提高召回率,建议使用宽松模型。
4. 任务调度 :SemRep的批量模式由调度器管理,多个远程用户的请求会按计划完成。调度器会显示可用的工作站数量和平均处理速度。
5. 下载结果 :批量任务完成后,用户会收到一个URL,可下载与任务相关的多个文件,常见的输出文件如下表所示:
| 文件名称 | 描述 |
| ---- | ---- |
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



