
other
xianlingmao
这个作者很懒,什么都没留下…
展开
-
import 初探之一 —— 导入 Package
zz from http://bbs.bccn.net/thread-298525-1-1.htmlimport 初探之一 —— 导入 Package 简单地探讨一下 Python 中的 import,它的用法。这是第一篇。转载 2010-04-13 09:13:00 · 1386 阅读 · 1 评论 -
python xml处理中文时出现的错误
python xml处理中文时出现的错误,记录一下,以免忘记 "UnicodeDecodeError: ascii codec cant decode byte 0xe9 in position 0: ordinal not in range(128)"解决办法,在该python文件的前面加上如下几句,问题得到解决。import sysdefa原创 2010-04-05 17:08:00 · 3685 阅读 · 3 评论 -
SecureCRT 使用Zmodem从ubuntu传送文件
经常我们需要从windows利用工具(如secureCrt)连接到linux server 去处理数据SecureCRT可以使用linux下的zmodem协议来快速的传送文件, 就不用找ftp工具了 对secureCRT软件设置如下: 只要设置一下上传和下载的默认目录就行 options(选项)–>sessionoptions(会话选项)–>X/Y/Zmod原创 2010-04-07 12:59:00 · 3106 阅读 · 0 评论 -
[zz] 隐马尔可夫模型(HMM)简介
这篇文章是我看过的关于HMM最好的文章之一,值得仔细揣摩,这篇文章里面有一些错误,如计算和表达,需要注意。隐马尔可夫模型(HMM)简介http://xiaofeng1982.blog.163.com/blog/static/315724582009824103618623/ 隐马尔可夫模型(HMM)简介请各位读者深吸一口气……呼…… 开始…转载 2010-05-15 22:14:00 · 4396 阅读 · 0 评论 -
zz使用 Python 分离中文与英文的混合字串
使用 Python 分离中文与英文的混合字串 LiYanrui posted @ 大约 1 年前 in 程序设计 with tags python , 614 阅读 这个问题是做 MkIV 预处理程序时搞定的,就是把一个混合了中英文混合字串分离为英文与中文的子字串,譬如,将 ”转载 2010-05-26 15:07:00 · 7323 阅读 · 0 评论 -
ZZ python处理中文
以下为我在处理网页编码问题看的文章,现在写爬虫自己处理网页编码问题确实比较麻烦,网页也没有规定一定要在META头信息里带编码信息,而很多人写的探测编码就是获取META,这是不可取的,而有的人则是分析HTTP返回的数据包里边的charset,如(a.headers.getparam(charset)),而HTTP包没有规定一定要带charset,所以也不是可靠的办法。转载 2010-05-26 14:53:00 · 1935 阅读 · 0 评论 -
熵与信息量的理解
有人说:“熵越大,信息量越小”也有人说:“熵越大,信息量越大”到底在香农的信息框架下,熵指的是什么?信息量指的又是什么呢?上面的两种说法哪种是对的呢?给定一个随机变量X,它的熵定义为 H(X)=- /sum (p_x * log p_x)熵只是刻画系统或者变量不确定性的一个量,并不是刻画系统信息量的一个量,但是它与信息量是有关系的,什么关系呢?当我们谈论信息量的时候应该是指原创 2010-05-28 17:14:00 · 24158 阅读 · 2 评论