
科研
咆哮蜗牛
这个作者很懒,什么都没留下…
展开
-
NLP software package
1、GeniaTagger : POS tagging, shallow parsing, and named entity recognition for biomedical text2、CoreNLP : POS tagger, the named entity recognizer (NER), the parser, and the coreference resolution原创 2013-05-06 20:50:39 · 1496 阅读 · 2 评论 -
最大熵马尔科夫和隐马尔科夫比较 MEMMs HMMs
MEMMs:最大熵马尔科夫模型转移概率: HMMs:隐马尔科夫模型转移概率(可以把转移概率和发射概率合起来看作转移概率):MEMMs可以利用更多的特征,如大小写,词缀,前后词等等,即可以很好的利用上下文MEMMs的参数估计很费力,但是对于很多NLP任务是可以解决的。翻译 2013-05-09 09:55:28 · 1530 阅读 · 0 评论 -
语言模型 Language Modeling
1、语言模型的定义 : 符号含义: V-->语言中所有单词的集合,且为有限集; -->语言中的句子,且n>=1,,为特殊符号STOP(假设STOP不在V中); -->有限集V上的所有句子的集合,为无限集,包含只有一个特殊符号STOP的句子。 正式定义: 语言模型由有限集V和概率函数组成,且满足,原创 2013-05-09 15:33:33 · 3583 阅读 · 0 评论 -
自然语言处理术语 NLP术语
AI (artificial intelligence) 人工智能anaphora 照应语:如 it,these people,the target genesantecedent 先行词:照应语所指代的词apposition 同位语:Lily,a seven-year-old girl,obtains the first place in the competition。Lily原创 2013-05-10 11:04:30 · 2309 阅读 · 0 评论 -
Jensen不等式及其证明
如有错误,欢迎指正word版证明:Jensen不等式及其证明.docxhttp://download.youkuaiyun.com/detail/x_yz_/5362227原创 2013-05-12 18:21:57 · 14646 阅读 · 1 评论 -
自然语言处理缩写词_NLP缩写词_术语解释
NLP:Natural Language Processing,自然语言处理Anaphora Resolution:the problem of resolving what a pronoun, or a noun phrase refers toAnaphora 回指,亦称指示性指代:所谓回指是当前的指示语与上下文中出现的词、短语、句子(句群)存在密切的语义关联;Coreferen原创 2013-05-10 13:40:59 · 4515 阅读 · 1 评论 -
标记偏置 隐马尔科夫 最大熵马尔科夫 HMM MEMM
隐马尔科夫模型(HMM):图1. 隐马尔科夫模型隐马尔科夫模型的缺点: 1、HMM只依赖于每一个状态和它对应的观察对象: 序列标注问题不仅和单个词相关,而且和观察序列的长度,单词的上下文,等等相关。 2、目标函数和预测目标函数不匹配: HMM学到的是状态和观察序列的联合分布P(Y,X),而预翻译 2013-04-24 13:53:09 · 3167 阅读 · 0 评论