- 博客(9)
- 收藏
- 关注
转载 词形还原(Lemmatization)
词形还原(Lemmatization)是文本预处理中的重要部分,与词干提取(stemming)很相似。 简单说来,词形还原就是去掉单词的词缀,提取单词的主干部分,通常提取后的单词会是字典中的单词,不同于词干提取(stemming),提取后的单词不一定会出现在单词中。比如,单词“cars”词形还原后的单词为“car”,单词“ate”词形还原后的单词为“eat”。 在Python的nltk模块...
2019-03-11 11:56:23
818
转载 PMI(Pointwise Mutual Information)
https://blog.youkuaiyun.com/index20001/article/details/79079031
2019-03-11 11:46:32
3397
原创 见习报告
1.如果你想成为一名软件工程师,你认为学校应该对你进行怎样的培养? 首先是课程的设置, 我认为学校应该在原本课程上做出修改,减少与计算机无关课程的比重, 增加有关计算机科学与技术和编程语言的课程,比如: 离散数学,数据结构,算法分析,数据库原理等, 让我们对软件工程原理、软件工程开发使用有更多的了解。通过综合性课程设计实施创新思维和创新方
2017-06-30 23:07:05
938
1
原创 图像压缩编码
6.1 图像编解码概述 图像压缩编码的必要性:信息时代带来了"信息爆炸",使数据量大增,因此,无论传输或存储都需要对数据进行有效的压缩。图像的数据量非常大,为了有效传输和存储图像,有必要压缩图像的数据量,而且随着现代通信技术的发展,要求传输的图像信息的种类和数据量愈来愈大,若不对其进行数据压缩,便难以推广应用。 图像压缩编码的可行性:从压缩的客体——"数
2017-04-10 16:09:28
456
原创 图像特征提取
4.1 图像的边缘检测 1) 图像的边缘是指其周围像素灰度急剧变化的那些像素的集合,它是图像的最基本特征。边缘存在于目标、背景和区域之间,所以它是图像分割所依赖的最重要的依据。由于边缘是位置的标志,对灰度的变化不敏感,因此,边缘也是图像匹配的重要特征。 2) 何为‘’角点‘’ 角点就是极值点,即在某方面属性特别突出的点。当然,你可以自己定义角点的属
2017-04-06 23:14:31
551
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人