
python
azhao_dn
关注hadoop 数据挖掘
展开
-
[python]用profile协助程序性能优化
本文最初发表于恋花蝶的博客http://blog.youkuaiyun.com/lanphaday,欢迎转载,但请务必保留原文完整,并保留本声明。原文链接:http://blog.youkuaiyun.com/lanphaday/article/details/1483728 [python]用profile协助程序性能优化 上帝说:“选择了脚本,就不要考虑性能。”我是很支持这句话的,使用转载 2011-10-31 15:34:00 · 1056 阅读 · 0 评论 -
python 的跨包引用
python的跨包引用方法 假设包的层次结构如下:package1/ __init__.py subPack1/ __init__.py module_11.py module_12.py module_13.py subPack2/ __init__.py原创 2012-03-21 13:49:25 · 5047 阅读 · 0 评论 -
python获取程序运行目录和脚本目录
import osimport sys#获取脚本所在目录print os.path.split( os.path.realpath( sys.argv[0] ) )[0]#获取脚本运行目录print os.getcwd()在脚本所在目录运行: python test.py/home/hadoop/home/hadoop在其他目录运行:python hadoop/test.原创 2012-03-23 15:47:07 · 21959 阅读 · 1 评论 -
lxml包引入错误
在使用第三方包lxml引入etree模块时报错:>>> from lxml import etreeTraceback (most recent call last): File "", line 1, in ?ImportError: dynamic module does not define init function (initetree) 由于之前安装是直接使用源码包进行原创 2012-04-25 17:55:36 · 27872 阅读 · 0 评论 -
开发自定义python 迭代器
class test(object): def __init__(self,data_iter,stop): self.data_iter = data_iter self.stop = stop self.start = 0 def __iter__(self): return self def next原创 2012-04-16 10:35:17 · 1084 阅读 · 0 评论 -
Python Decorator初体验
查看原文前段时间在看一些有关python web framwork的时候,发现在python语言里竟然有“@”符号,一查资料,原来是python装饰器(python装饰器也可以通过除了“@”的其他语法进行定义)。装饰器,是一种设计模式,用于动态地给对象添加行为,之前的一篇文章也提到过。python中也有装饰器,不过和普遍意义上的装饰器不同,python中的装饰器实际上是一种“语法糖”,是一转载 2012-06-06 16:37:54 · 6443 阅读 · 0 评论 -
使用Jython操作HBase
查看原文之前使用Python的PLY写了一个操作HBase的类SQL编译器的雏形,目前还只初步完成了词法语法分析器,等开始写后面的预处理器、逻辑计划产生器和物理计划产生器的时候,问题出现了:HBase以及整个Hadoop项目都是用Java写成的,当然是使用Java API最直接。如果想使用其他语言的API接口,可以有这么几种方式:Thrift APIRESTful API其他基转载 2012-06-06 16:40:05 · 2441 阅读 · 1 评论 -
jython对hadoop的封装项目
在Hadoop API的Python封装方面,著名音乐站点Last.fm发布了基于Python的Dumbo(小飞象)项目,Dumbo能够帮助Python开发者更方便的编写Hadoop应用,并且Dumbo为MapReduce应用提供了灵活易用的PythonAPI。Last.fm的开发者,同时也是Dumbo项目发起人Klaas Bosteels 认为,对于定制Hadoop应用,使用Pyth原创 2012-06-06 16:45:48 · 1609 阅读 · 0 评论 -
lighttpd+webpy安装实践
1)安装lighttpd:wget http://download.lighttpd.net/lighttpd/releases-1.4.x/lighttpd-1.4.30.tar.gz./configure -prefix /opt/modules/lighttpdmakemake installcp doc/initscripts/rc.lighttpd.redhat /e原创 2012-05-17 16:30:44 · 2384 阅读 · 0 评论 -
redis安装和使用
一、redis安装 1)下载redis最新稳定版:http://redis.googlecode.com/files/redis-2.4.14.tar.gz 2)解压安装:make & make test 3)可能需要安装tcl8.5: 3.1)下载tcl8.5源码包:wget http://downloads.so原创 2012-06-13 09:21:56 · 1984 阅读 · 0 评论 -
python with as语法
with从Python 2.5就有,需要from __future__ import with_statement。自python 2.6开始,成为默认关键字。 也就是说with是一个控制流语句,跟if/for/while/try之类的是一类的,with可以用来简化try finally代码,看起来可以比try finally更清晰。这里新引入了一个"上下文管理协议"contex转载 2012-06-13 14:06:28 · 49432 阅读 · 0 评论 -
python连接mysql报错
python连接mysql报错:不能通过该sock文件/var/log/mysql/mysql.sock连接mysql 查看my.cnf文件,发现配置中的sock路径是/tmp/mysql.sock,但是python mysql接口在连接mysql时使用的不是该配置文件 解决办法:将my.cnf文件拷贝到/etc/my.cnf,在mysql连接函数中指定:read_def原创 2012-06-14 14:06:22 · 1171 阅读 · 0 评论 -
python 编码方式总结
python 编码方式总结(python内部使用unicode编码): >>> t='北京'>>> t'\xe5\x8c\x97\xe4\xba\xac' 1)urllib.quote(t) 将t转换为16进制编码 '%E5%8C%97%E4%BA%AC' urllib.unquote('%E5%8C%97%E4%BA%AC') 将16进制编码转换为内原创 2012-07-26 18:23:51 · 9265 阅读 · 0 评论 -
python输出excel能够识别的utf-8格式csv文件
可能大家都遇到过,python在输出的csv文件中如果有utf-8格式的中文,那么在使用excel打开该csv文件时,excel将不能够有效识别出文件中的中文数据,严重时甚至不能够识别出分隔符。那么,要怎样操作才能够让excel识别出utf-8格式的中文呢?方法其实很简单,见以下代码:import codecswith open('ExcelUtf8.csv', 'w') as f:原创 2013-11-27 18:24:02 · 24796 阅读 · 0 评论 -
Python正则表达式指南
查看原文本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例。本文的内容不包括如何编写高效的正则表达式、如何优化正则表达式,这些主题请查看其他教程。注意:本文基于Python2.4完成;如果看到不明白的词汇请记得百度谷歌或维基,whatever。 尊重作者的劳动,转载请注明作者及原文地址 >.html1.转载 2012-03-21 13:23:22 · 880 阅读 · 0 评论 -
python字符串格式化
查看原文字符串的格式化 在python中也有类似于c中的printf()的格式输出标记。在python中格式化输出字符串使用的是%运算符,通用的形式为格式标记字符串 % 要输出的值组其中,左边部分的”格式标记字符串“可以完全和c中的一致。右边的'值组'如果有两个及以上的值则需要用小括号括起来,中间用短号隔开。重点来看左边的部分。左边部分的最简单形式为:转载 2012-04-05 15:03:49 · 774 阅读 · 0 评论 -
python中eval, exec, execfile,和compile
此日志为转载,原文链接:http://skandgjxa.blog.163.com/blog/static/1415298201010262403483/eval(str [,globals [,locals ]])函数将字符串str当成有效Python表达式来求值,并返回计算结果。同样地, exec语句将字符串str当成有效Python代码来执行.提供给exec的代码的名转载 2011-10-31 15:34:41 · 13381 阅读 · 0 评论 -
python字典get函数陷阱
python字典get函数有一个很微妙的陷阱,代码如下:>>> t={1:2}>>> s={3:4}>>> t.get(1,s[1])Traceback (most recent call last): File "", line 1, in ?KeyError: 1>>> t.get(1,s.get(1,0))2 python字典的get函数在执行时,原创 2011-10-31 15:35:29 · 7163 阅读 · 0 评论 -
python命令行解析模块optionparser
原文链接:http://www.cnblogs.com/itech/archive/2010/12/31/1919017.html使用optionparser模块来解析optionparser的执行过程:导入optionparser : from optparse import OptionParser构造optionparser的对象:parser = OptionParser(转载 2011-10-31 14:46:19 · 22492 阅读 · 0 评论 -
python处理xml数据
由于最近需要使用python处理xml数据,因此到网上找了些资料学习了下。 最新学习的是python的xml.dom.minidom模块,按照资料上的说法,特地在python命令行环境验证了一下: 执行之后却发现xml.dom.minidom无法获取xml节点之间的文本值,代码如下: >>> test = "14" >>> t原创 2011-10-31 15:33:07 · 2440 阅读 · 0 评论 -
Python中文全攻略
转载,查看原文原创文章,转载请注明出处。 1. 在Python中使用中文在Python中有两种默认的字符串:str和unicode。在Python中一定要注意区分“Unicode字符串”和“unicode对象”的区别。后面所有的“unicode字符串”指的都是python里的“unicode对象”。事实上在Python中并没有“Unicode字符串”转载 2011-11-25 18:08:30 · 1269 阅读 · 0 评论 -
Python之struct模块浅谈
转载文章,查看原文今天杯具了,来公司竟然没带鼠标,凑或用desktop touchpad吧,哎~~ 看到在进行c格式的二进制文件读取的过程中,用到了struct.unpack方法,因此开始找struct模块的一些相关解释,网上没有看到很清晰的说明,那就根据Python v2.6.5 documentation自己写一个好了。 这个struct主要是用来处理C结构数据的,读入时先转载 2011-11-28 17:05:14 · 2029 阅读 · 0 评论 -
python2.4 解析json数据
python2.4版本解析json格式数据的快速方法: json = “{'body': '\xc3\xb2\xc2\x85\\u0003', 'timestamp': 1322510400069L, 'pri': 'INFO', 'nanos': 12592772776111L, 'host': 'hadoop08', 'fields': {}}” tmp = eval(js原创 2011-11-28 17:07:48 · 4433 阅读 · 0 评论 -
python升级
1、下载wget http://www.python.org/ftp/python/2.6.5/Python-2.6.5.tar.bz22、解压tar jxvf Python-2.6.5.tar.bz23、编译安装cd Python-2.6.5./configuremake && make installPython 默认安装目录在/usr/local/lib/py转载 2012-01-11 17:54:04 · 864 阅读 · 0 评论 -
ujson 安装使用记录
由于项目需要使用python解析json数据,因此到网上找了一些python解析json模块方面的资料。 根据查找到的资料发现,人们使用的最多的json解析库是simplejson,json及cjson,而且按照网上的说法cjson的效率最好。 于是我就安装了cjson进行测试>>> import cjson>>> dir(cjson)['DecodeError'原创 2012-02-08 11:57:37 · 15679 阅读 · 0 评论 -
python easy_install工具安装
在安装python第三方类库时,python提供了一个类似于yum的命令easy_install,但是系统一般都是不会自带easy_install命令的,故将easy_install命令的安装方法介绍如下: 1)下载setuptools:wget http://pypi.python.org/packages/2.4/s/setuptools/setuptools-0.6c11-py2原创 2012-02-14 16:08:34 · 6705 阅读 · 0 评论 -
python连接mongodb环境配置
1)安装python-devel,如果不安装的话在安装pymongo时会出现报警WARNING: The pymongo._cmessage extension module could notbe compiled. No C extensions are essential for PyMongo to run,although they do result in significan原创 2012-02-14 16:17:54 · 3450 阅读 · 0 评论 -
python之强大的日志模块
作者:txw1958 | 出处:博客园 | 2011/10/21 19:41:55 | 阅读43次1.简单的将日志打印到屏幕 import logginglogging.debug('This is debug message')logging.info('This is info message')logging.warning('This is转载 2012-03-05 11:45:15 · 30468 阅读 · 0 评论 -
日志数据中使用xml格式注意事项
在日志中使用xml格式可以有效的提高日志的扩展性和可读性,但是由于xml严格的格式要求导致xml解析很容易出错,出错的原因通常是日志写入端在写入日志时没有遵循xml格式规范或者是使用了非ascll编码的字符。非ascll编码的字符很容易导致xml格式失效,下面就是一个非ascll字符导致xml解析失败的例子: 在定位问题的过程中,这些非ascll字符很难通过肉眼来察觉,因原创 2012-03-31 11:26:25 · 1114 阅读 · 0 评论 -
实现字符型进度条(pyton、java)
大家在linux上使用wget时,wget命令会向linux命令行界面输出进度条,但平时也没有太留意这些细节。最近由于需要给产品人员提供后台分析程序,虽然不需要实现界面,但为了让程序更人性化一些,于是计划在dos界面上实现进度条的输出。 实现原理: 在向标准输出输出数据时,可以使用 \r 字符实现回退到该行的头部,如:sys.stdout.write(‘\原创 2013-12-12 15:15:19 · 10209 阅读 · 0 评论