
自然语言处理
Seal_Wings
日常问题解决方法整理。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
实体识别模型演变与相关论文汇总
模型演变与相关论文汇总 说明 论文关键信息提取: 作者想研究什么(introduction);采用了什么方法或方案(Results and Discussion);最后得出了什么结论。(最后再看实验方案。) 基础 《统计自然语言处理》命名实体识别部分 基于规则 ⬇ 大规模语料库的统计方法 条件随机场相关论文: 基于条件随机场的命名实体识别研究_郭家清 基于条件随机场的中文命名实体识别_向晓雯 基...原创 2020-04-07 21:17:19 · 429 阅读 · 0 评论 -
社保领域知识图谱构建练手小实验(3)——社保领域概念提取算法
emmmm,直接照着文章中的实验部分做的。 首先通过词性搭配规则获得候选概念 jieba分词与词性标注 对每种组成结构的概念进行统计(n-gram算法)原创 2020-04-06 10:06:21 · 356 阅读 · 0 评论 -
社保领域知识图谱构建练手小实验(2)——社保领域概念提取算法的训练语料准备
社保领域概念提取框架 分词和词性标注是后续实体识别、关系抽取等步骤的关键基础。 论文复现仍然主要依据《社保领域知识图谱构建及应用研究_李佳恒》。 “社保领域概念大多数为一些由基本概念的组合而来的长词,而这些词一般是不会出现在分词工具的词典中,这种词被称作未登录词。解决这种问题有两种主流方法,一种是基于有监督机器学习的领域概念提取算法。这种方法需要人工对数据进行标注,利用隐马尔科夫和条件随机场等模型...原创 2020-04-02 22:25:49 · 675 阅读 · 0 评论 -
社保领域知识图谱构建练手小实验(1)——数据预处理
练手数据 使用先前做文献计量学相关实验时为CiteSpace所下载的结构化的数据,原始数据为纯文本。 (原始数据可以通过下面的链接自取) 链接:https://pan.baidu.com/s/1IzP5VLAlz3h82kD0BZXU5Q 提取码:ywbx 复制这段内容后打开百度网盘手机App,操作更方便哦 数据预处理 1、用Python编程提取出其中的摘要部分。 """ 抽取出download_...原创 2020-03-24 22:09:17 · 891 阅读 · 0 评论 -
《Python机器学习基础教程》(二)——处理文本数据(交叉验证、网格搜索)
第7章 处理文本数据 1.1思维导图 1.2代码 参考链接: 1.3涉及到的算法原创 2019-11-06 20:26:24 · 764 阅读 · 0 评论 -
python文本挖掘(二)——实例1(TF-IDF算法)
分析小说《玩偶之家》 参考链接: 文本可视化[一]——《今生今世》词云生成与小说分析原创 2019-10-30 09:29:29 · 6217 阅读 · 0 评论 -
Python文本相似度分析(tf-idf)
。。。原创 2019-11-05 11:25:21 · 2155 阅读 · 0 评论 -
词汇处理——词义辨析消歧(一)
经典方法 详细介绍解决NLP词义辨析消歧的经典方法 研究现状 对NLP词义辨析消歧的综述介绍原创 2019-11-04 12:12:58 · 4835 阅读 · 0 评论 -
python文本挖掘(一)
标题原创 2019-10-28 19:45:15 · 1795 阅读 · 0 评论