
python
文章平均质量分 53
iteye_16691
这个作者很懒,什么都没留下…
展开
-
ubuntu python2.6安装模块
环境 ubuntu 10.04 LTS , python2.65 要安装某模块,以为要将该目录复制到python中的site-packages目录中,于是找出这个目录:locate python|grep site-package 得出目录 /usr/local/lib/python2.6/dist-packages , 于是复制目录但是import 时发现出错了,没有找到该目...原创 2011-07-31 23:28:43 · 485 阅读 · 0 评论 -
python 汉字按拼音排序
python 汉字按拼音排序, 原理很简单,就是根据汉字拼音字典,将汉字转为拼音,然后sort一下就好了,不过对于多音字倒是没有办法了。 #encoding:utf-8import redef sort_pinyin (names): '''pinyin.txt: 吖 a1 阿 a1 啊 a1 锕 a1 錒 a1 嗄 a2 厑 aes...原创 2014-01-20 15:41:09 · 4384 阅读 · 0 评论 -
python转换已转义的字符串
python转换已转义的字符串有时我们可能会获取得以下这样的字符串:>>> a = '{\\"name\\":\\"michael\\"}'>>> print a{\"name\":\"michael\"} 那么该如何将其转换为一个字典呢?可以用以下的方法:>>> ty原创 2016-04-17 11:31:25 · 811 阅读 · 0 评论 -
Python 解析XML
Python 解析XML 使用模块lxml安装: pip install lxmlpip install requestsfrom lxml import htmlimport requestspage = requests.get('http://econpy.pythonanywhere.com/ex/001.html')tree = html.from...原创 2016-02-17 14:44:42 · 284 阅读 · 0 评论 -
python 代码实现四则运算 (前缀表达式) 递归 非递归
python 代码实现四则运算 (前缀表达式) 计算表达式如下:(+ 1 2 )(+ 1 (+ 2 3))(* (+ 1 2) (*3 4)) 第一个函数cal_1 是使用递归的形式;第二个函数cal_2 是使用非递归的形式--堆栈, 且第二个支持多个参数(2个或以上) #calculator expressiondef cal_1 (s):...原创 2012-12-06 21:46:18 · 1364 阅读 · 0 评论 -
python 正文内容提取
正文提取: 平时打开一个网页,除了文章的正文内容,通常会有一大堆的导航,广告和其他方面的信息。本博客的目的,在于说明如何从一个网页中提取出文章的正文内容,而过渡掉其他无关的的信息。 这里先看看 demo : http://2.tingxinwen.duapp.com/extract_context 本方法是基于文本密度的方法,最初的想法来源于哈工大的《基于行块分布函数的...原创 2013-11-19 09:23:40 · 1901 阅读 · 0 评论 -
python 打印字典
python 打印字典 python 中,如果字典里面又有字典,则输出不好看。方法一:使用内置的pprint方法二:自己写一个函数 method 1:>>> d = {1:{'who':{'name':'Michael','age':20,'job':{'P':'90-91','G':'91-93'}}},2:{'who':{'name':'Mary'...原创 2013-10-23 13:05:31 · 3992 阅读 · 0 评论 -
python 中文分词 (windows) pymmseg
pymmseg windows下中文分词, 下载附件, 直接 import 目录就行了。 #coding=utf-8 from pymmseg import mmseg mmseg.dict_load_defaults() text = '今天的天气真好啊,我们一起出去玩一下吧'algor = mmseg.Algorithm(text) ...原创 2012-05-05 18:08:30 · 170 阅读 · 0 评论 -
k-means python代码
k-means python代码 def fun_dis (x,y,n): return sum (map (lambda v1,v2:pow(abs(v1-v2),n), x,y))def distance (x,y): #return fun_dis (x,y,2) return fun_dis (x,y,1) def mi...原创 2012-09-20 23:29:44 · 521 阅读 · 0 评论 -
计算不同的词出现的次数
今天去笔试个java职位,要求写个统计不同词的出现次数,我java写不出来,写了几句py代码上去。回来后,在群上讨论了一下,写了以下三个方法,前两种我写的,最后一种是别人写的三种方法用时的比较:0.405999898911--------------------------------1.32800006866--------------------------------0.90599989...原创 2012-02-08 21:08:37 · 191 阅读 · 0 评论 -
编译pypcap
pypcap是python用于抓包的东西,有windows中的2.4,2.5二进制版本,2.6,2.7的就要自己编译了。 为方便日后查找,贴在这里,原文在这里:http://code.google.com/p/pypcap/issues/detail?id=11 方法是 1) Download and install MinGW32.2) add MinGW's "\b...原创 2011-10-07 18:24:14 · 216 阅读 · 0 评论 -
python 生成pyc文件和可变长参数
将.py生成.pyc文件# filename 为.py的文件路径import py_compilepy_compile.compile(filename) 可变长参数(函数中的参数个数不确定)def multipar(*s): ss = '' for i in s: ss += i return ss a = multipa...原创 2010-06-22 16:04:41 · 158 阅读 · 0 评论 -
简单的crawler,python
以下是十分简单的python写的爬虫小脚本。import os,reimport urlparse,urllib,urllib2import hashlib,Queueclass Request(object): def __init__(self): self.url= '' self.error_url = [] ...2010-06-07 12:00:30 · 262 阅读 · 0 评论 -
python 中文分词,安装 pymmseg
在python这pymmseg-cpp 还是十分方便的! 环境 ubuntu10.04 , python2.65 步骤:1 下载mmseg-cpp的源代码 http://code.google.com/p/pymmseg-cpp/2 tar -zxf pymmseg-cpp*.tar.gz //解压后得到pymmseg 目录 cd pymm...原创 2011-07-31 23:38:14 · 262 阅读 · 0 评论 -
jinja2 笔记
Jinja2 笔记 显示html的内容: {{ content | escape }} 过滤html的标签 jinja2 filter html tag{{ content | striptags }} 取前x个字符{{ content | truncate (20) }}原创 2014-05-04 23:46:16 · 184 阅读 · 0 评论