从社交媒体数据中识别药物不良反应事件及无线传感器网络路由协议方案
1. 药物不良反应事件识别
在药物安全监测领域,从社交媒体数据中识别药物及潜在的药物事件是一项重要的工作。
1.1 数据预处理
从不同健康论坛收集的数据需要进行预处理。具体操作步骤如下:
- 使用开放的自然语言处理工具去除不需要的数据。
- 采用常规的自然语言处理技术,如分词、正则表达式、停用词去除、词干提取等进行文本清理。
- 利用句子分词器将每个用户关于药物的评论分割成单独的句子。
1.2 药物实体提取
- NER方法 :命名实体识别(NER)是从文本语料中发现概念类型的自然语言处理过程。该系统依赖于来自UMLS和FDA的多个药物名称词典,使用MetaMap识别和提取与医学词典来源匹配的药物术语。具体算法步骤如下:
Algorithm 1: Drug Entity Extraction Using NER Approach
Input: Text data Collected from Social Health Forums, Blogs
Output: Labeled tokens
Steps:
1. Preprocessing as explained in Sect. 3.1
2. Locating and extracting drug names from data collected using the
Lexicon developed from UMLS and FDA