
NLP_ML
sakurawangz
这个作者很懒,什么都没留下…
展开
-
VSM - 向量空间模型
一个文本表现为由标点和文字组成的字符串,由字成词,由词生短语,由短语组成句子,进而是段落,节,篇章。要使计算机能够高效的处理真实文本,必须找到一个可行的并且理想的表示方案。这种表示一方面需要真实反映文档内容,另一方面要对不同文档有区分能力。 向量空间模型(Vector Space Model)是一种自然语言处理中常用的模型,它是G.Salton等人在二十世纪60年代提出的,最早用...2009-10-26 18:59:41 · 550 阅读 · 0 评论 -
汉语语言分析(2) - 短语
短语的结构其实就是汉语句子结构的基本形态。因为,广义上,笔者认为一个普通的句子,就可以看成主谓结构的短语,比如百家争鸣,百花齐放。 短语主要分为下述几种: ①[b]并列短语[/b],由两个或两个以上的名词、动词、形容词并列组成的短语。如老师和同学、调查研究、培养和提高、万紫千红、理直气壮、丰功伟绩、是非黑白等。 ②[b]偏正短语[/b],词和词按修饰关系构成的短语,由定...2009-11-10 22:34:47 · 405 阅读 · 0 评论