阿秋就是阿秋-优快云博客

原创笔记：语言模型（Language Model）（一）

笔记，总结纪录自《统计自然语言处理（第二版）（宗成庆）》语言模型（language model， LM）在自然语言处中，尤其是基于统计模型的语音识别、机器翻译、汉语自动分词、句法分析等相关研究中都有广泛的应用。其中最主要采用的是n元语法模型（n-gram），这种模型构建简单、直接，但因为数据缺乏需要采用平滑（smoothing）算法。一个语言模型中，通常构建为字符串s的概率分布p(s)，反映的是字符

2017-11-25 16:26:17 6242 1

转载 [转]Ubuntu上安装CRF++

下载CRF++-0.58.tar.gz 解压缩：tar -zxvf CRF++-0.58.tar.gz2.cd到压缩包目录，安装执行：./configure

2017-11-17 14:51:39 661

原创 python爬虫（urllib简介）

urllib模块通过url打开任意资源，官方链接urllib模块提供一个高级接口，可以在通过url在网上获取数据。其中，urlopen()函数类似于内置函数open()，但接受的是url不是文件名。只能打开用于读取的url，不能任何查找操作。urllib.urlopen(url[, data[, prpxies[, context]]])其中，url是网址，data表示以post方式提交到url的数

2017-11-14 17:31:02 442

原创 linux命令小记（grep、awk、sed）

grepgrep 标准egrep 扩展grep，支持基本和正则，执行效果与grep -E相似fgrep 快速grep，允许查找字符串而不是一个模式常用参数-c 只输出匹配的行的总数（count） -C 加参数num表示，显示匹配的行，及其前后num行 -d 当参数不是普通文件而是目录时 -f 把要匹配的模式写进一个文件中，然后传给grep -h 查询多个文件时，不显示文件名 -l

2017-11-14 10:11:56 2158

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 笔记：语言模型（Language Model）（一）

转载 [转]Ubuntu上安装CRF++

原创 python爬虫（urllib简介）

原创 linux命令小记（grep、awk、sed）

空空如也

空空如也

原创笔记：语言模型（Language Model）（一）