自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 笔记:语言模型(Language Model)(一)

笔记,总结纪录自《统计自然语言处理(第二版)(宗成庆)》语言模型(language model, LM)在自然语言处中,尤其是基于统计模型的语音识别、机器翻译、汉语自动分词、句法分析等相关研究中都有广泛的应用。其中最主要采用的是n元语法模型(n-gram),这种模型构建简单、直接,但因为数据缺乏需要采用平滑(smoothing)算法。一个语言模型中,通常构建为字符串s的概率分布p(s),反映的是字符

2017-11-25 16:26:17 6169 1

转载 [转]Ubuntu上安装CRF++

下载CRF++-0.58.tar.gz 解压缩:tar -zxvf CRF++-0.58.tar.gz2.cd到压缩包目录,安装执行:./configure

2017-11-17 14:51:39 623

原创 python爬虫(urllib简介)

urllib模块通过url打开任意资源,官方链接urllib模块提供一个高级接口,可以在通过url在网上获取数据。其中,urlopen()函数类似于内置函数open(),但接受的是url不是文件名。只能打开用于读取的url,不能任何查找操作。urllib.urlopen(url[, data[, prpxies[, context]]])其中,url是网址,data表示以post方式提交到url的数

2017-11-14 17:31:02 413

原创 linux命令小记(grep、awk、sed)

grepgrep 标准egrep 扩展grep,支持基本和正则,执行效果与grep -E相似fgrep 快速grep,允许查找字符串而不是一个模式常用参数-c 只输出匹配的行的总数(count) -C 加参数num表示,显示匹配的行,及其前后num行 -d 当参数不是普通文件而是目录时 -f 把要匹配的模式写进一个文件中,然后传给grep -h 查询多个文件时,不显示文件名 -l

2017-11-14 10:11:56 2067

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除