
python
文章平均质量分 68
bob007
这个作者很懒,什么都没留下…
展开
-
python 编码详解
在编写python代码时一般要在页首指定编码格式#-*- coding:gbk -*-如果指定了编码格式为gbk,则如果想在代码读取一个非utf-8格式的文件,则需要首先读取的信息转成gbkinfile = file(spath, 'r')line = infile.readline().strip()line = line.decode('gbk')但是当我们加了这一原创 2013-01-16 09:42:35 · 537 阅读 · 0 评论 -
潜在语义分析Latent semantic analysis note(LSA)原理及代码实现
Latent Semantic Analysis (LSA)也被叫做Latent Semantic Indexing(LSI),从字面上的意思理解就是通过分析文档去发现这些文档中潜在的意思和概念。假设每个词仅表示一个概念,并且每个概念仅仅被一个词所描述,LSA将非常简单(从词到概念存在一个简单的映射关系)不幸的是,这个问题并没有如此简单,因为存在不同的词表示同一个意思(同义词),一个词表示多个原创 2014-06-13 16:40:24 · 17291 阅读 · 9 评论