
自然语言处理
文章平均质量分 80
波特王子
csdn太难用了,唉
展开
-
贴一个关于 label bias problem 的解释
我看 John Lafferty 的那篇 CRF 论文里谈到了 label bias problem,不过解释得并不是非常的清晰, 我当时看的不太明白, 在网络上查一下, 发现一个 mail-list 上讨论这个问题, 解释的比较清楚。更多的讨论参看http://wing.comp.nus.edu.sg/pipermail/graphreading/2005-September/000031转载 2012-10-27 10:14:04 · 2947 阅读 · 0 评论 -
汉语词性对照表[北大标准/中科院标准]
词性编码词性名称 注 解Ag形语素 形容词性语素。形容词代码为 a,语素代码g前面置以A。 a形容词 取英语形容词 adjective的第1个字母。 ad副形词 直接作状语的形容词。形容词代码 a和副词代码d并在一起。 an转载 2012-07-07 23:00:49 · 3711 阅读 · 0 评论 -
最大熵工具包的使用
最大熵工具包的使用 最大熵是自然语言处理中经常用到的一种统计方法。网上也有很多最大熵方面的工具包,目前大家用得最多的应该是张乐博士写的最大熵工具包了。该工具包既可以采用命令行形式运行,也可以直接调用接口函数,为大家的研究工作带来了很大的方便。但是,对于刚接触到该工具包的人来说,使用起来还是有些麻烦的。一、命令行形式使用方法 1、利用命令行形式,首先要准备好特征文件。特转载 2010-03-31 15:27:00 · 2112 阅读 · 1 评论 -
BM25算法浅析
BM25算法,通常用来作搜索相关性平分。一句话概况其主要思想:对Query进行语素解析,生成语素qi;然后,对于每个搜索结果D,计算每个语素qi与D的相关性得分,最后,将qi相对于D的相关性得分进行加权求和,从而得到Query与D的相关性得分。BM25算法的一般性公式如下:其中,Q表示Query,qi表示Q解析之后的一个语素(对中文而言,我们可以把对Query的分词作为语素分析,每个词转载 2011-09-18 20:18:51 · 681 阅读 · 0 评论 -
Maximum Entropy Modeling Toolkit for Python and C++(转载)
Maximum Entropy Modeling Toolkit for Python and C++Introduction |License |Download |Document |FAQ(new) |History |ContactNews20060810Haven't touched the code for such a long tim转载 2009-10-29 23:07:00 · 1810 阅读 · 0 评论 -
计算所汉语词性标记集
计算所汉语词性标记集Version 3.0制订人:刘群张华平张浩 0. 说明计算所汉语词性标记集主要用于中国科学院计算技术研究所研制的汉语词法分析器、句法分析器和汉英机器翻译系统。本标记集主要参考了以下词性标记集:1. 北大《人民日报》语料库词性标记集;2. 北大2002新版词性标记集(草稿);3.转载 2012-07-07 23:03:45 · 2410 阅读 · 0 评论 -
Distributional hypothesis
The Distributional Hypothesis in linguistics is the theory that words that occur in the same contexts tend to have similar meanings.[1] The underlying idea that "a word is characterized by the com转载 2012-09-20 02:12:12 · 2145 阅读 · 0 评论 -
最大熵马尔科夫模型
转载 2012-10-14 02:10:23 · 1032 阅读 · 0 评论 -
Tensor(张量)
source: http://en.wikipedia.org/wiki/TensorTensors are geometric objects that describe linear relations between vectors, scalars, and other tensors. Elementary examples of such relations include转载 2013-03-25 21:11:02 · 1253 阅读 · 0 评论