5G 技术专利文本挖掘与技术演进路径分析
1. 研究背景与目的
本研究首次对 5G 技术内容进行分类,并建立有意义的演进路径,旨在通过对 5G 通信专利的文本挖掘,揭示技术演进规律和未来趋势,为 5G 技术的研究和发展提供有价值的参考。
2. 研究方法
2.1 数据来源
- 专利数据来自中国知识产权局专利数据库(SIPO)和 SooPAT 数据库。
- 搜索关键词:使用“第五代移动通信”、“5G”以及 5G 领域主要特定模块技术“毫米波”和“MIMO”作为扩展关键词,构建搜索词“theme = (第五代移动通信 OR 5G) AND summary = (毫米波 OR MIMO)”。
- 搜索日期:2018 年 12 月。
- 搜索范围:2015 - 2018 年在中国申请的有效发明专利。
- 数据筛选:搜索得到 175 项发明专利,去除无效和无关专利后,获得 160 项发明专利。选取专利摘要和主权项作为专利文本分析内容,创建文档集用于文本分析。
2.2 研究方法
2.2.1 自然语言处理
- 数据预处理 :原始文本信息复杂且存在大量噪声,需进行预处理,包括分词、去除停用词和标点符号、提取标签。使用 Python 的 jieba 包进行自然语言处理,将文本内容分割成单词,去除无意义的词和标点,对数据进行降噪。
- 关键词提取 :使用词袋模型提取关键词并统计词频,过滤技术相关性低的