自然语言处理&知识图谱 论文阅读

本文介绍了一种早期的Word Embedding方法,通过全球上下文和多词原型改进词表示,解决了一词多义的问题。论文由Huang等人于2012年发表在ACL会议上,该方法首先训练词向量,然后对特定词的上下文进行聚类,为每个意义创建不同的词向量。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

论文阅读记录

本人以前是搞深度学习和图像相关的,由于种种原因和个人规划,开始转做自然语言处理和知识图谱相关的研究。由于有一定基础,所以对NLP内容理解起来也比较方便,目前已经补充和学习了一些知识,以后用本文记录一些我阅读的文献。

论文

Huang et al. ACL 2012, 多义词表示

Huang, Eric H , et al. “Improving word representations via global context and multiple word prototypes.” Meeting of the Association for Computational Linguistics: Long Papers Association for Computational Linguistics, 2012.

本文是较早用于解决word embedding一词多义的文章,也是比较基本的方法。思路:1. 先使用普通方法训练得到word vectors. 2. 给定词w和窗口大小L,在语料库中筛选出包含词w的所有句子(句子长度保留2L+1). 3. 对这些包含词w的句子聚类(k-means)成多个簇,然后把单词w按照簇分成好多种,w_1,w_2,…w_n. 4. 把原有语料库中的w替换成对应的w_i,看成不同的词. 4. 换下一个词w,重新进行2-4操作,直到所有词都细分完。5. 重新训练词向量。 这样不同含义的词就有不同的词向量了,输入一个词时,先根据所在句子判断是哪个簇的,然后在使用对应的词向量。

[语法讲义].朱德熙.扫描版.pdf 《现代汉语词类研究》.郭锐.扫描版.pdf 《现代汉语语法研究教程》.陆俭明.扫描版.pdf 一种基于句子分割的文法自动推导算法.pdf 一种细粒度的评价对象抽取及倾向性判别方法.pdf 中文功能组块分析及应用研究.pdf 中文句法语义分析及其联合学习机制研究.pdf 人机对话系统中若干关键问题研究.pdf 从树库的实践看句本位和中心词分析法的生命力.pdf 关于CKY句法分析效率的实验性研究.pdf 关联文法语法分析的并行处理研究.pdf 口语对话系统中的一种稳健语言理解算法.pdf 句法分析树标注集及事件分析.pdf 基于Chart算法的句法分析系统的设计与实现.pdf 基于一种新的合成核的中文实体关系自动抽取.pdf 基于中心驱动模型的宾州中文树库(CTB)句法分析.pdf 基于中文的句法分析系统的研究与实现.pdf 基于二元组合文法的语义知识库构建.pdf 基于动作建模的中文依存句法分析.pdf 基于句法分析与依存分析的评价对象抽取.pdf 基于层次模型的中文句法分析.pdf 基于树库和机器学习的汉语依存句法分析.pdf 基于树库的汉语依存句法分析.pdf 基于概率上下文无关语法的句法分析研究与实现.pdf 基于统计的自然语言处理.pdf 基于自然语言理解的自动应答技术及应用研究.pdf 基于语义的汉语句法分析系统的研究与实现.pdf 基于语料库学习的多主题自动问答系统研究.pdf 基于语法功能匹配的句法分析算法.pdf 机器翻译原理与方法讲义(05)基于句法的统计机器翻译方法.pdf 汉语句子的组块分析体系.pdf 汉语句法分析方法研究.pdf 汉语多重关系复句的关系层次分析.pdf 汉语并列结构的自动识别.pdf 汉语概率型上下文无关语法的自动推导.pdf 统计句法分析建模中基于信息论的特征类型分析.pdf 自然语言处理-句法剖析论文.pdf 自然语言理解的语义分析在产品设计中的应用.pdf 融合丰富语言知识的汉语统计句法分析.pdf 限定领域的基本陈述句句法分析.pdf 面向中文问答系统的问句句法分析.pdf
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值