- 博客(4)
- 资源 (7)
- 收藏
- 关注
原创 语言模型中常见的平滑处理技术
语言模型中常见的平滑处理技术为什么需要平滑处理技术?在使用语言模型直接计算某个句子出现的概率时,可能会由于某个单词或单词对出现的概率为0而导致整个句子出现的概率为0。例如下面这个场景:在上面的场景中,由于部分单词对出现的概率为0,导致最终两句话出现的概率均为0。但实际上,s1=“今天没有训练营”比s2=“今天训练营没有”更符合语法习惯,我们也更希望计算出来的P(s1)大于P(s2)。为...
2020-03-13 18:04:37
2884
原创 Python实现世界人口地图
1.世界人口地图介绍本程序将从一个人口数据集中提取出每个国家2010年的人口数量,然后利用Pygal中的地图制作工具,将其展示在地图上。本程序将使用population_data.json文件,它包含全球大部分国家1960~2010年的人口数据,来源:https://ehmatthes.github.io/pcc/2.获取两个字母的国别码Pygal中的地图制作工具要求数据为特定的格式:用国...
2018-10-30 16:16:05
3482
1
原创 (数据可视化)Python实现随机漫步图像
参考《Python编程:从入门到实践》1.随机漫步介绍随机漫步是这样行走得到的路径:每次行走都完全是随机的,没有明确的方向,结果是由一系列随机决策决定的。你可以这样认为,随机漫步就是蚂蚁在晕头转向的情况下,每次都沿随机的方向前行所经过的路径。在自然界、物理学、生物学、化学和经济领域,随机漫步都有其实际用途。例如,漂浮在水滴上的花粉因不断受到水分子的挤压而在水面上移动。水滴中的分子运动是随机的...
2018-10-27 16:36:04
2027
原创 《数学之美》读书笔记
第1章文字和语言VS数字和信息文字作为信息的载体,而非信息本身,这就使得不同语言的文字可以相互翻译,因为它们承载信息的能力是等价的。实际上,数字也可以作为信息的载体,这构成了现代通信的基础。因此,文字和数字是统一的,它们都是信息编码的单位。在早期,数字还是文字的一部分,但是阿拉伯数字的诞生,标志着数字和文字的分离,两者各自的发展,逐渐产生了数学和语言学。人类文明早期的文字是象形文字,后...
2018-05-11 17:58:49
473
CRF++源代码 0.58版本 zip和tar.gz两种格式
2020-01-11
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人