
【Python】
文章平均质量分 73
goto456
这个作者很懒,什么都没留下…
展开
-
【Error】Python:UnicodeDecodeError: ‘XXX' codec can't decode bytes in position... 解决方法
错误信息:UnicodeDecodeError: ‘XXX' codec can't decode bytes in position 2-5: illegal multibyte sequence 这是因为遇到了非法字符,例如:全角空格往往有多种不同的实现方式,比如\xa3\xa0,或者\xa4\x57,这些字符,看起来都是全角空格,但它们并不是“合法”的全角空格真正的全角空原创 2014-05-13 19:54:52 · 23549 阅读 · 0 评论 -
【Python】Python的urllib、urllib2模块调用“百度翻译”API进行批量自动翻译
1.问题描述在文本数据处理时,经常回出现文本中各种语言的混杂情况,包括:英文、日语、俄语、法语等,需要将不同语种的语言批量翻译成中文进行处理。可以通过Python直接调用百度提供的翻译API进行批量的翻译。百度翻译API详细文档见:百度翻译API文档2.问题解决开发环境:Linux将文本中的中文和非中文进行分离,对非中文的部分进行翻译。Python的代码如下:#原创 2014-12-31 15:37:26 · 6504 阅读 · 0 评论 -
【Python】Python取top N相关的模块:heapq模块
最近在程序中需要取一个列表的top 3元素,就是去一个列表中数值最大的3个元素。这可以用Python的heapq模块来处理。1、对列表取top N:现在有一个列表myList,需要取出该列表的最大3个元素和最小3个元素,按如下代码所述的简单例子:test.pyimport heapqmyList = [5, 2, 6, 12, 7, 3, 4, 9]topNum = 3 n原创 2014-05-20 19:47:38 · 17806 阅读 · 0 评论 -
【Python】Python处理Json文件
最近用到Python来处理Json文件,对Python的Json模块熟悉了一下,下面是一个简单的程序用Python的Json模块来处理Json文件并写到一个新的Json文件中去,希望对大家有所帮助。1、问题描述:需要加载一个Json文件,并将Json中的某些项进行修改,然后写回到一个新的Json文件中去。程序代码如下:test.pyimport json原创 2014-05-26 19:35:40 · 38459 阅读 · 6 评论 -
【Python】Python的urllib模块、urllib2模块进行网页下载文件
由于需要从某个网页上下载一些PDF文件,但是需要下载的PDF文件有几百个,所以不可能用人工点击来下载。正好Python有相关的模块,所以写了个程序来进行PDF文件的下载,顺便熟悉了Python的urllib模块和ulrllib2模块。1、问题描述需要从http://www.cvpapers.com/cvpr2014.html上下载几百个论文的PDF文件,该网页如下图所示:2、问原创 2014-06-30 18:36:49 · 32131 阅读 · 2 评论 -
【Python】用Python的“结巴”模块进行分词
之前都是用计算所的分词工具进行分词,效果不错但是比较麻烦,最近开始用Python的“结巴”模块进行分词,感觉非常方便。这里将我写的一些小程序分享给大家,希望对大家有所帮助。下面这个程序是对一个文本文件里的内容进行分词的程序:test.py#!/usr/bin/python#-*- encoding:utf-8 -*-import jieba原创 2014-06-17 20:11:42 · 17225 阅读 · 5 评论 -
【Python】使用Supervisor来管理Python的进程
1.问题描述 需要一个python的服务程序在后台一直运行,不能让该进程被杀死,即使被杀死也要能及时自动重启。如:有一个python的程序:test.py ,通过命令:python test.py来运行程序,但是它会受命令行的中断而中断。所以我们需要一个方法来保证该程序一直在后台运行。2.解决方法以前经常用命令:nohup python test.py & 来保证其在原创 2015-03-30 19:15:37 · 8125 阅读 · 0 评论 -
【Python】Python用ConfigParser管理配置文件
Python也提供了一个管理配置文件的模块:ConfigParser,有了这个我们在写程序的时候就可以把一些配置信息单独写到配置文件中就可以了,如:数据库的连接信息等。1.配置文件的格式配置文件必须按照特定的格式:param.conf[mysqlDB]host = 127.0.0.1port = 22username = mynamepassword = 123456原创 2015-03-30 20:12:39 · 2317 阅读 · 0 评论 -
【Python】将python的py文件编译成保密的pyc文件
由于python程序的py文件很容易泄露源代码,所以python可以编译成保密的pyc文件。python的pyc文件是一种二进制文件,py文件变成pyc文件后,加载的速度有所提高,而且pyc是一种跨平台的字节码,是由python的虚拟机来执行的,这个是类似于JAVA或者.NET的虚拟机的概念。编译py文件到pyc文件的方法:在命令行输入:python -m py_com原创 2015-03-30 19:38:28 · 6938 阅读 · 1 评论 -
【Python】Python在文本分析中将中文和非中文进行分割
1.问题描述进行文本分析的时候需要将中文和非中文进行分开处理,下面通过Python将文本中的中文部分提取出来进行需要的处理。2.问题解决开发环境:Linux程序代码如下:split.py#!/usr/bin/python#-*- coding:utf-8 -*-import sysreload(sys)sys.setdefaultencoding("ut原创 2014-12-31 16:21:15 · 16177 阅读 · 2 评论 -
【Python】Python文本处理中用langid工具包来对文本进行语言检测与判别
1.问题的描述用Python进行文本处理时,有时候处理的文本中包含中文、英文、日文等多个语系的文本,有时候不能同时进行处理,这个时候就需要判别当前文本是属于哪个语系的。Python中有个langid工具包提供了此功能,langid目前支持97种语言的检测,非常好用。2.程序的代码以下Python是调用langid工具包来对文本进行语言检测与判别的程序代码:import langid原创 2014-12-22 18:36:41 · 6788 阅读 · 1 评论 -
【Error】Python:ascii codec can't decode byte 0xe8 in position 0:ordinal not in range(128)
最近编写Python程序时经常遇见中文相关的问题,这里说一个问题的解决方法。我在使用json模块的dumps()函数时,因为涉及到中文,报出如下错误:ascii codec can't decode byte 0xe8 in position 0:ordinal not in range(128)这是编码相关的问题,在该程序中加入如下代码:import sysreload(sys)sys.setdefaultencoding('utf-8')这样就可以解决该问题了,希望对大家有所帮助。原创 2014-05-20 19:05:01 · 9409 阅读 · 1 评论 -
【Python】Python对文件夹的操作
上一篇介绍了Python对文件的读写操作,现在来介绍一下Python对文件夹的操作。由于我是项目中用到的,所以我就以我的实际应用实例来说明吧。希望对大家有所帮助。原创 2014-05-19 19:56:55 · 6716 阅读 · 0 评论 -
【Python】Python对字典排序
引子字典,形如 dic = {'a':1 , 'b':2 , 'c': 3},字典中的元素没有顺序,所以dic[0]是有语法错误的。并且不可以有重复的键值,所以 dic.add['c'] = 4后,字典变成 {'a':1 , 'b':2 , 'c': 4}.待解决问题如何根据需要可以根据“键”或“键值”进行不同顺序的排序?函数原型sorted(dic,val转载 2014-05-26 19:05:25 · 1297 阅读 · 0 评论 -
【Error】Python:SyntaxError: Non-ASCII character '\xe5'解决方法
在编写Python程序时,程序中有中文时经常会出现错误信息:SyntaxError: Non-ASCII character '\xe5' 出现这种情况,可以用如下解决办法:python的默认编码文件是用的ASCII码,你将文件存成了UTF-8,解决办法很简单,在文件开头加入如下代码:#coding=utf-8这就可以了。原创 2014-05-20 18:55:36 · 5045 阅读 · 0 评论 -
【Python】Python对文件的读写操作
刚刚接触Python,感觉其对文件的操作还是很方便的。下面是我入门Python对文件操作的一个简单程序,希望对初学者有所帮助。原创 2014-05-19 19:15:19 · 11685 阅读 · 0 评论 -
【Python】Python获取命令行参数
有时候需要用同一个Python程序在不同的时间来处理不同的文件,此时如果老是要到Python程序中去修改输入、输出文件名,就太麻烦了。而通过Python获取命令行参数就方便多了。下面是我写得一个小程序,希望对大家有所帮助。比如下面一个程序test.py是通过接受命令行两个参数,并打印出这两个参数。import sys #需导原创 2014-06-17 20:27:58 · 15071 阅读 · 0 评论 -
【Python】Python用Bottle轻量级框架进行Web开发
当前Python Web开发中的框架算Django最为流行了,但是本文介绍的是一个较为轻量级的Web框架:Bottle框架。理论性的东西就不讲了,直接上实例代码。1.问题描述 最近做一个系统的后台开发,用的就是Python+Bottle进行的web后台开发。给前台提供一个接口,通过前台调用接口时的参数,提供Json数据格式的数据。2.环境准备我用的是Li原创 2015-01-31 11:58:23 · 20828 阅读 · 1 评论 -
【Python】Bottle框架下Python Web开发的跨域访问
上一篇文章中介绍了Python应用Bottle轻量级框架进行Web开发,这次介绍Bottle框架下的跨域访问的问题。 当前台跨域访问时,会无法从后台得到数据,也就是说跨域访问失败。解决办法如下:在程序中定义一个函数代码如下:#!/usr/bin/python# -*- conding:utf-8 -*-from bottle import *#deco原创 2015-01-31 14:16:42 · 5666 阅读 · 3 评论 -
【Python】Python应用Redis作为缓存来提高数据存取效率
缓存机制应用特别广泛,尤其是对数据存取的实时性效率要求比较高的情况下,就更需要引进缓存机制了。今天来介绍一下在在Python程序中应用Redis缓存机制来提高数据存取效率。1.问题描述开发的程序需要从数据库中取出数据返回给用户,但是用户需要频繁通过程序从数据库中取数据,并且数据的重复性较高,这样平凡的通过程序从数据库中取数据的效率比较低,严重影响了效率。2.解决方法原创 2015-03-31 21:52:03 · 5367 阅读 · 1 评论