
Python
夜月xl
这个作者很懒,什么都没留下…
展开
-
Python 3.x在WIN7下安装
背景:之前建个人站点gnssinfo.com曾从网上download了一个开源的python 2.x版本的工具,用来从163上下载blog;这两天把python 2.7删掉,然后安装最新版3.3,无法启动,换装3.2同样无法启动,均提示以下错误:Fatal Python error: Py_Initialize: unable to load the file system cod转载 2014-08-25 23:58:07 · 2671 阅读 · 1 评论 -
Pandas之DataFrame操作
Pandas是Python下一个开源数据分析的库,它提供的数据结构DataFrame极大的简化了数据分析过程中一些繁琐操作。 1. 基本使用:创建DataFrame. DataFrame是一张二维的表,大家可以把它想象成一张Excel表单或者Sql表。Excel 2007及其以后的版本的最大行数是1048576,最大列数是16384,超过这个规模的数据Excel就会弹出个框框“此文本包含多行文本,转载 2015-09-11 11:22:17 · 47666 阅读 · 1 评论 -
中文dump后写入json文件无法显示中文
If ensure_ascii is True (the default), all non-ASCII characters in the output are escaped with \uXXXX sequences, and the result is astrinstance consisting of ASCII characters only. Ifensure_asci原创 2015-10-28 16:14:39 · 13065 阅读 · 4 评论 -
Python字符编码详解
原文:http://www.cnblogs.com/huxi/archive/2010/12/05/1897271.html1. 字符编码简介1.1. ASCIIASCII(American Standard Code for Information Interchange),是一种单字节的编码。计算机世界里一开始只有英文,而单字节可以表示256个不同的字符,可以表示所有的转载 2015-12-08 21:02:32 · 389 阅读 · 0 评论 -
瞭解Unicode
在這章節我們將介紹什麼是Unicode,在我們理解Unicode之前,得先理解什麼是編碼,同時我們必需先回首過去,才能理解為什麼需要有Unicode什麼是編碼?在學習程式語言時,必需理解一個很重要的觀念,那就是在電腦裡的所有東西都是使用數字來表示的,不管是電影、圖片、聲音,理所當然的,文字也一樣是由數字來表示的,而事實上電腦裡能儲存的數字範圍也不是沒有限制,每個Byte能儲存的範圍转载 2015-12-10 10:51:05 · 393 阅读 · 0 评论 -
Python读写并且修改Excel
背景Python中,想要打开已经存在的excel的xls文件,然后在最后新的一行的数据。 折腾过程1.找到了参考资料:writing to existing workbook using xlwt其实是没有直接实现:打开已有的excel文件,然后在文件最后写入,添加新数据的函数的。只不过,可以利用:Working转载 2015-11-18 18:01:50 · 45106 阅读 · 4 评论 -
python R 热度图聚类demo
今天调试程序,在Python中使用R进行热图聚类分析,要求对热图的显示颜色进行控制。可以利用heatmap.2中的col参数和breaks参数实现这一功能r['library']('pheatmap')r['library']('gplots')#r['library']('Cairo')imgpath = r'/static/temp_img/drug_recipe_cluster原创 2015-12-15 18:10:38 · 2746 阅读 · 0 评论 -
python使用函数默认值来实现函数静态变量的功能
今天尝试Python并行计算,想利用静态变量计数,从而知道函数被运行了几次Python本身是不支持静态变量的,但是我们可以通过函数的默认值来实现静态变量的功能。 当函数的默认值是内容是可变的类时,类的内容可变,而类的名字没变。(相当于开辟的内存区域没有变,而其中内容可以变化)。 这是因为python中函数的默认值只会被执行一次,(和静态变量一样,静态变量初始化也是被执行一次。)这就是她转载 2015-12-09 15:44:11 · 659 阅读 · 0 评论 -
一行Python代码完成并行任务
众所周知,Python的并行处理能力很不理想。我认为如果不考虑线程和GIL的标准参数(它们大多是合法的),其原因不是因为技术不到位,而是我们的使用方法不恰当。大多数关于Python线程和多进程的教材虽然都很出色,但是内容繁琐冗长。它们的确在开篇铺陈了许多有用信息,但往往都不会涉及真正能提高日常工作的部分。经典例子DDG上以“Python threading tutorial (Py转载 2015-12-09 21:51:08 · 2875 阅读 · 0 评论 -
Python 多线程教程:并发与并行
在批评Python的讨论中,常常说起Python多线程是多么的难用。还有人对 global interpreter lock(也被亲切的称为“GIL”)指指点点,说它阻碍了Python的多线程程序同时运行。因此,如果你是从其他语言(比如C++或Java)转过来的话,Python线程模块并不会像你想象的那样去运行。必须要说明的是,我们还是可以用Python写出能并发或并行的代码,并且能带来性能的显著转载 2015-12-09 17:49:02 · 1295 阅读 · 0 评论 -
django 快速搭建blog
转自 http://www.cnblogs.com/fnng/p/3737964.html(更正了其中的一些错误)如果本文看不懂的,去看的我视频吧!http://www.testpub.cn/------------------------------------------- Django 自称是“最适合开发有限期的完美WEB框架”。本文参考《Dja转载 2015-12-26 23:00:45 · 600 阅读 · 0 评论 -
python flask api get时ValueError("No JSON object could be decoded")
发请求:http://127.0.0.1:8073/api/graph/chufang?input=['发热','头痛'] if request.method == 'GET': r_query = request.args.to_dict() input_text = json.loads(r_query['input'])报错:原创 2016-02-18 15:00:25 · 2383 阅读 · 0 评论 -
re.sub使用[]进行多目标替换
re.sub(u"[(。)((.*?))(\(.*?\)]", '', drug_str)原创 2016-02-24 14:53:42 · 6239 阅读 · 0 评论 -
Pymongo: TypeError: if no direction is specified, key_or_list must be an instance of list
使用pymongo对某一字段进行sort时,报错 TypeError: if no direction is specified, key_or_list must be an instance of list问题代码:items = db.symptomAssociation.find({ 'result.pre.0':{'$regex':input_text}}).sort({'r原创 2016-02-25 17:11:34 · 15847 阅读 · 8 评论 -
pip/easy_install failure: failed to create process
使用pip install requests安装requests,报错: failed to create process解决方法:执行python -m pip install --upgrade pip --force-reinstall原创 2016-06-26 02:20:27 · 4662 阅读 · 0 评论 -
Python生成一定范围内指定数目的无重复随机数
利用Python生成一定范围内指定数目的无重复随机数:mi为下限,ma为上限,num为数目,输出为num个数的列表# 无重复生成一定范围内指定数目的随机数def random_without_same(mi, ma, num): temp = range(mi, ma) random.shuffle(temp) return temp[0:num]原创 2015-09-17 14:32:23 · 8873 阅读 · 0 评论 -
UnicodeEncodeError: ‘gbk’ codec can’t encode character u’\u200e’ in position 43: illegal multibyte s
【问题】python中已获取网页:http://blog.youkuaiyun.com/hfahe/article/details/5494895的html源码,其时UTF-8编码的。提取出其标题部分:?12345<span class="link_title"> 在转载 2015-11-05 10:34:26 · 2134 阅读 · 0 评论 -
Python学习笔记(一)
Python变量变量的命名(同其他计算机语言类似)-变量名有字母、数字、下划线组成。-不能以数字开头-不可以使用关键字变量的赋值:是变量声明和定义的过程id(变量名) #id()查看变量a在内存中的地址同一地址可以有多个引用(即多个变量名)运算符与表达式Python运算符包括-赋值运算符-算术运算符-关系运算符-逻辑运算符表达原创 2015-04-11 10:27:55 · 444 阅读 · 0 评论 -
Python学习笔记(二)
Python流程控制if语句用法:if expression: statement(s)else:statement(s)注:Python使用缩进作为其语句分组的方法,建议使用4个空格代替缩进逻辑值(bool)用来表示诸如:对与错,真与假,空与非空等概念逻辑值包含两个值:-True:表示非空的量(比如:string, tuple, list, set原创 2015-04-11 14:09:37 · 515 阅读 · 0 评论 -
Python学习笔记(三)
函数-自定义函数-预定义的Python函数为什么使用函数:1.降低编程的难度2.代码重用函数的定义和调用def 函数名(参数列表):#可以没有参数函数体def hello():print "hello python"调用函数的一般形式是:-函数名 (参数列表)hello()形参和实参def fun(x):原创 2015-04-12 14:03:30 · 444 阅读 · 0 评论 -
SyntaxError: Non-ASCII character '\xe8' in file
用Python进行编程,运行时出现如下错误SyntaxError: Non-ASCII character '\xe8' in file查了下Python的默认编码文件是用的ASCII码只要在文件开头加入#-*- coding: UTF-8 -*-或者 #coding=utf-8就可以了原创 2015-04-26 21:02:53 · 6746 阅读 · 0 评论 -
Python IDEL查询和修改当前目录
先要装载os模块:import osprint os.getcwd()或print os.path.abspath(os.curdir)print os.path.abspath('.')( . 代表当前的路径,.. 代表当前路径的上一级路径。例如:以Winodws系统为例: 当前路径是F:\Temp, 则 . 的绝对路径就是F:\Temp转载 2015-05-13 19:24:48 · 1086 阅读 · 0 评论 -
将Python中unicode模式转换成中文
中文格式即utf8a = x"中国"x'\xd6\xd0\xb9\xfa's = a.encode("utf8")print s中国new'\xc3\x96\xc3\x90\xc2\xb9\xc3\xba'原创 2015-05-14 13:14:56 · 16458 阅读 · 1 评论 -
Python报错:ProgrammingError: You must not use 8-bit bytestrings unless you use a text_factory that can
ProgrammingError: You must not use 8-bit bytestrings unless you use a text_factory that can interpret 8-bit bytestrings (like text_factory = str). It is highly recommended that you instead just switch原创 2015-05-17 11:11:45 · 4178 阅读 · 0 评论 -
python 利用 setup.py 手动安装第三方类库 - cocoajin
python 利用 setup.py 手动安装第三方类库由于我在mac使用时,装了python3,默认有python2的环境,使用 pip 安装第三方类库时,老是安装到 python2的环境上;在想办法安装到python3上时,费了不少力气;在家里的windows电脑上安装了python3,在使用pip安装类库时,虽然安装在了python3上,可是在创建测试项目还是impo转载 2015-05-18 21:21:09 · 1362 阅读 · 0 评论 -
pandas 数据归一化以及行删除例程
pandas 数据归一化以及行删除例程#coding:utf8import pandas as pdimport numpy as npfrom pandas import Series,DataFrame# 如果有id列,则需先删除id列再进行对应操作,最后再补上# 统计的时候不需要用到id列,删除的时候需要考虑# delete rowdef row_del(df, num_原创 2015-07-23 11:28:40 · 16262 阅读 · 0 评论 -
Python解析json文件报错:'utf8' codec can't decode byte 0xbb in position 0: invalid start byte
今天尝试读一个json文件,一直报错代码:f = file('relation.json')d = json.load(f)报错:在使用Python的时候,经常会碰到这个报错,之前一直弄不清楚是什么问题,今天专门研究了一下,报错的意思大概是,无法解码,在位置0处有非法的开始字节。了解后发现,在utf-8编码文件中BOM在文件头部,占用三个字节,用来标示该文件属于u原创 2015-09-30 10:34:14 · 42007 阅读 · 1 评论 -
UnicodeDecodeError: 'ascii' codec can't decode byte 0xb3 in position 4: ordinal not in range(128)
今天在将str数据写入Excel时,Python 报错:UnicodeDecodeError: 'ascii' codec can't decode byte 0xb3 in position 4: ordinal not in range(128)解决方案:将数据decode成gbk格式,在写入Excel原创 2015-11-04 16:23:04 · 1279 阅读 · 0 评论 -
Python遍历文件夹中文件
import osimport os.pathrootdir = “d:\data” # 指明被遍历的文件夹for parent,dirnames,filenames in os.walk(rootdir+os.sep+'PDFs'): #三个参数:分别返回1.父目录 2.所有文件夹名字(不含路径) 3.转载 2015-11-04 15:16:57 · 808 阅读 · 0 评论 -
Python利用nltk的clean_html提取htm文件的内容
import osimport codecs# import nltkimport refrom pdf_extract import extract_patterndef clean_html(html): """ Copied from NLTK package. Remove HTML markup from the given string.原创 2015-11-04 16:34:02 · 3284 阅读 · 0 评论 -
python的str,unicode对象的encode和decode方法
python的str,unicode对象的encode和decode方法 python中的str对象其实就是"8-bit string" ,字节字符串,本质上类似java中的byte[]。 而python中的unicode对象应该才是等同于java中的String对象,或本质上是java的char[]。 对于 Python代码 s="你好" u=u转载 2015-11-04 21:33:51 · 1851 阅读 · 0 评论