
python
文章平均质量分 51
IT界的小小小学生
写文章的目标不仅是解决问题,更是帮助阅读的人或企业实现商业价值。秉持 “从解决问题出发、在实践中学习,最终创造价值”的信念,予人玫瑰手留余香!
展开
-
Python IDE 6.0.0 安装
Python开发Notepad++是一款不错的编辑器,但是对于习惯了IDE的程序猿还是差了点,代码补全、转到定义、语法高亮等各种没有,关键是还不能调试代码。所以,尤其对新手来说,找到一款合适的好用的IDE还是必要的。Wing IDE是一个专为Python程序语言设计的集成开发环境。目前Wing IDE已经是著名Python开发框架。Wing IDE的功能主要有:代码智能化 自动完成,通原创 2016-12-27 10:49:43 · 736 阅读 · 0 评论 -
pycharm 或者其他Python IDE不支持中文编码的解决方案
Python的自带编辑器IDLE或者Python Shell在默认情况下都不支持中文编码,若在脚本程序中出现中文,则会出现一定的错误。原因:因为Python脚本编码默认是ASCII编码的,当需要非ASCII编码的字符出现在脚本程序中时,需要添加相应的编码声明。解决方法:添加中文编码声明:在脚本程序的第一行或者第二行中添加:#coding=UTF-8 或# -原创 2017-03-15 14:22:11 · 1686 阅读 · 0 评论 -
递归与伪递归区别,Python 实现递归与尾递归
递归函数在函数内部,可以调用其他函数。如果一个函数在内部调用自身本身,这个函数就是递归函数。(1) 递归就是在过程或函数里调用自身。(2) 在使用递归策略时,必须有一个明确的递归结束条件,称为递归出口。递归一般用于解决三类问题: (1)数据的定义是按递归定义的。(n的阶乘) (2)问题解法按递归实现。(回溯) (3)数据的结构形式是按递归定义的。(二叉树的遍历,图的原创 2017-03-15 15:47:02 · 2362 阅读 · 0 评论 -
Python基本常用包整理(data analysis and machine learning),附查询包版本语句
python 数据分析模块(Numpy、Scipy、Scikit和Pandas等)python进行机器学习(tensorflow)一、①NumpyPython科学计算的基础包②Pandas提供了大量处理结构化数据的数据结构和函数,它是使Python成为强大的数据分析工具的最重要的工具③Matplotlib用于绘图的Python库④SciPy包含了一系列解原创 2017-05-30 20:28:27 · 4505 阅读 · 0 评论 -
Python中if __name__ == "__main__": 的作用
Python中if __name__ == "__main__": 的作用在很多python脚本中在最后的部分会执行一个判断语句if __name__ == "__main__:",之后还可能会有一些执行语句。那添加这个判断的目的何在?在python编译器读取源文件的时候会执行它找到的所有代码,而在执行之前会根据当前运行的模块是否为主程序而定义变量__name__的值为__main原创 2017-05-30 22:25:01 · 825 阅读 · 0 评论 -
python 如何查看与更换工作目录
# -*- coding: utf-8 -*-#导入OS包import os#os.getcwd()查看当前目录print('\n当前目录位置:')print(os.getcwd())#os.chdir修改目录os.chdir("E:\python_py\python1_learn")print('\n修改后目录位置:')print(os.getcwd())原创 2017-05-31 13:32:19 · 1947 阅读 · 0 评论 -
python2.7进行爬虫百度POI代码(划分小网格算法)
查询许久,最终选择一个,之前一直py3.6不成功,换了2.7就好多了。如果有重复去下重即可。这里面非常重要的基类对象的init()方法与超类方法,将在下面进行记录。# -*- coding:utf-8 -*-import jsonimport urllib2import sysimport impimport time#显示当前系统编码print(sys.getdefau原创 2017-06-04 23:52:25 · 2675 阅读 · 0 评论 -
Python中的__init__()方法整理中(两种解释)
解释一:看懂了就不用看第二种了__init__()方法是Python学习当中重要的基础知识,__init__()方法意义重大的原因有两个。第一个原因是在对象生命周期中初始化是最重要的一步;每个对象必须正确初始化后才能正常工作。第二个原因是__init__()参数值可以有多种形式。因为有很多种方式为__init__()提供参数值,对于对象创建有大量的用例,我们可以看看其中的几个。我们原创 2017-06-05 00:19:29 · 15539 阅读 · 1 评论 -
windows下多版本python环境变量设置与pip不同版本方法(三步骤)
1。对于两个版本首先要添加进去环境变量,这个很简单,网上有很多,一半找到文件所属目录即可,即文件属性(F:\anaconda2)2.对于两个版本的python分别命名python2与python33.指定安装包(pip)win+r ------->cmd-------> python3 -m pip install Pillow 其中Pillow是包原创 2017-06-05 14:45:47 · 4646 阅读 · 0 评论 -
Python信贷数据处理与初步分析(ZIP解压)
#!/usr/bin/python# coding=utf-8''' @author: lenovo@software: 3.6 PyCharm@file: 8W信贷数据处理.py@time: 20170531@function:Credit data processing and preliminary analysis 信贷数据处理与初步分析@ed原创 2017-06-01 13:45:36 · 2288 阅读 · 0 评论 -
Python 用OPEN读文件报错 ,路径以及r
Python 中 ‘unicodeescape’ codec can’t decode bytes in position XXX: trun错误解决方案背景描述今天在运用Python pillow模块处理图片时遇到一个错误SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position原创 2017-06-01 21:45:56 · 4400 阅读 · 0 评论 -
Python 2.7.x 和 Python 3.x 的主要区别
参考网址:http://www.kuqin.com/shuoit/20140728/341451.html点击打开链接原创 2017-06-01 22:20:17 · 704 阅读 · 0 评论 -
Python中的random模块用于生成随机数
Python中的random模块用于生成随机数。下面介绍一下random模块中最常用的几个函数。 random.randomrandom.random()用于生成一个0到1的随机符点数: 0 random.uniform random.uniform的函数原型为:random.uniform(a, b),用于生成一个指定范围内的随机符点数,两个参数其中一个是上限,原创 2017-06-01 22:55:04 · 2138 阅读 · 0 评论 -
python 报错'gbk' codec can't encode character '\ue5d1' in position 0:
在网络怕爬虫过程中遇到,编码错误'gbk' codec can't encode character '\ue5d1' in position 0: illegal multibyte sequenceresponse = requests.get(url)html_uid = response.text# name=html_uid["result"]['name']# pat原创 2017-06-17 16:08:35 · 3485 阅读 · 0 评论 -
python中从str中提取元素到list以及将list转换为str
在Python中时常需要从字符串类型str中提取元素到一个数组list中,例如str是一个逗号隔开的姓名名单,需要将每个名字提取到一个元素为str型的list中。如姓名列表str = 'Alice, Bob, John',需要将其提取为name_list = ['Alice', 'Bob', 'John']。而反过来有时需要将一个list中的字符元素按照指定的分隔符拼接成一个完整的原创 2017-06-07 19:37:39 · 2711 阅读 · 0 评论 -
Python笔记从html中提取字段
def fun(): # url = 'http://quote.eastmoney.com/sh600010.html?from=BaiduAladdin' url_total = 'http://api.map.baidu.com/place/v2/search?q=景区&page_size=20&page_num=1®ion=白山市&scope=2&output=jso原创 2017-06-07 21:29:25 · 3590 阅读 · 0 评论 -
运行map()后,报:map object at 0x026427B0 <map>解决方法与原因分析
2018博客之星评选,如果喜欢我的文章,请投我一票,编号:No.009 [支持连接]() ,万分感谢!!!1 如下python 3例子:l = range(1,21)def op(x): r = 1 for i in range(1,x + 1): r *= i return rlist1 = (map(op,l))print (list1...原创 2017-06-09 14:32:25 · 12966 阅读 · 3 评论 -
Python中map函数
python中的map()函数map(function, iterable, ...)1.对可迭代函数'iterable'中的每一个元素应用‘function’方法,将结果作为list返回。>> def add100(x):... return x+100... >>> hh = [11,22,33]>>> map(add100,hh)[111, 122, 1原创 2017-06-10 22:06:57 · 1828 阅读 · 0 评论 -
python strip()函数 删除字符串中无空白字符或者是无用字符
函数原型声明:s为字符串,rm为要删除的字符序列s.strip(rm) 删除s字符串中开头、结尾处,位于 rm删除序列的字符s.lstrip(rm) 删除s字符串中开头处,位于 rm删除序列的字符s.rstrip(rm) 删除s字符串中结尾处,位于 rm删除序列的字符注意:1. 当rm为空时,默认删除空白符原创 2017-07-03 15:49:41 · 4284 阅读 · 0 评论 -
ubantu(linux)下如何安装pycharm(下载)配置
下载-解压-执行1.从http://www.jetbrains.com/pycharm/download/下载最新的Pycharm 选择community版本2.在终端中进入Pycharm的下载目录,打开终端,输入命令 tar xfz pycharm-*.tar.gz,将Pycharm文件夹解压到当前目录3.找到bin文件夹运行Pycharm.sh(.sh 是一个原创 2017-07-13 00:10:08 · 3263 阅读 · 0 评论 -
python 下利用os模块创建目录以及巧妙使用if not os.path.exits()创建
一、单独使用os.makedirs(path,mode=0o777)import ospath='d\\test'os.makedirs(path,0755)print('路径被创建')二,循环创建path=base_path+'\\'+"ciliylist[i]"if not os.path.exists(path) os.makedirs原创 2017-07-13 00:34:55 · 10144 阅读 · 0 评论 -
Python 把字典的key和value的值取出来,按照顺序存入到list中
题目:把字典的key和value的值取出来,按照顺序存入到list中#-*-coding:utf-8-*-#创建字段d={'name':'cheng','age':20,'sex':'female'}#创建空列表a=[]#将字典中键和值循环取出添加到列表中for i in d.keys(): a.append(i) a.append(d[i])print a原创 2017-07-04 14:57:36 · 41494 阅读 · 0 评论 -
Python读取json文件,并转化为字典进行提取字段(出现索引must be int,not str)解决方案
Python读取json文件,并转化为字典进行提取字段(出现索引must be int,not str)解决方案def craw_file(): di_review_keyword=[] for i in range(10): with open('E:\python_py\景区详情\\test\\'+'北京'+'_'+str(0)+'_'+str(1)原创 2017-07-04 17:51:30 · 5636 阅读 · 0 评论 -
python文件打开方式详解——a、a+、r+、w+区别
第一步 排除文件打开方式错误:r只读,r+读写,不创建w新建只写,w+新建读写,二者都会将文件内容清零(以w方式打开,不能读出。w+可读写)**w+与r+区别:r+:可读可写,若文件不存在,报错;w+: 可读可写,若文件不存在,创建r+与a+区别:[python]fd = open("1.txt",'w+') fd.write('123')转载 2017-06-14 19:13:43 · 4896 阅读 · 0 评论 -
python 多进程设置 整理版本1
在Python中,实现多进程是比较容易的。我们可以使用multiprocessing进行进程的创建,比如说 import multiprocessing as mp p = mp.Process(target=run_proc, args=('fireling',), name='Run_procProcess') p.start() p.join()这样就创建了一个进程,用原创 2017-07-18 15:19:53 · 728 阅读 · 0 评论 -
python 如何设置多线程
和多进程的思路类似,我们也可以实现对线程的创建,在Python中,使用threading包实现。参数如下: 构造方法: Thread(group=None, target=None, name=None, args=(), kwargs={}) group: 线程组,目前还没有实现,库引用中提示必须是None; target: 要执行的方法; name: 线程名;原创 2017-07-18 15:46:00 · 2609 阅读 · 0 评论 -
Python 用OPEN读文件报错 ,路径以及r
Python 中 ‘unicodeescape’ codec can’t decode bytes in position XXX: trun错误解决方案 今天在运用Python pillow模块处理图片时遇到一个错误 SyntaxError: (unicode error) ‘unicodeescape’ codec can’t decode bytes in position 2-3: tr原创 2017-07-19 02:31:23 · 2371 阅读 · 0 评论 -
python2.7进行爬虫百度POI代码(划分小网格算法)
查询许久,最终选择一个,之前一直py3.6不成功,换了2.7就好多了。如果有重复去下重即可。这里面非常重要的基类对象的init()方法与超类方法,将在下面进行记录。# -*- coding:utf-8 -*-import jsonimport urllib2import sysimport impimport time#显示当前系统编码print(sys.getdefaultencod转载 2017-07-19 02:34:13 · 876 阅读 · 0 评论 -
Python正则表达式匹配各种标准形式整理
正则表达式用于字符串处理、表单验证等场合,实用高效。现将一些常用的表达式收集于此,以备不时之需。匹配中文字符的正则表达式: [\u4e00-\u9fa5]评注:匹配中文还真是个头疼的事,有了这个表达式就好办了匹配双字节字符(包括汉字在内):[^\x00-\xff]评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)匹配空白行的正则表达式:\n\s*\r原创 2017-06-27 13:50:24 · 7142 阅读 · 0 评论 -
利用datetime进行日期获取,比如前100天的日期
当有人问你昨天是几号,是不是很容易就得到答案但当问你100天前是几号,你是不是又能很容易地得出答案?呵呵,让我们用程序来实现一下吧,datetime的timedeltime就派上用场了。import datetime(datetime.datetime.now() - datetime.timedelta(days = 100)).strftime("%Y-%m-%d")原创 2017-07-23 17:54:52 · 3152 阅读 · 0 评论 -
python读取与写入csv EXCEK HDF 文件
一. 数据文件 pd指pandas简称,df指DataFrame对象。1. csv读取 pd.read_csv('foo.csv')写入 df.to_csv('foo.csv')2. HDF5读取 pd.read_hdf('foo.h5', 'df')写入 df.to_hdf('foo.h5', 'df')3. Excel读取 pd.re原创 2017-07-23 18:31:27 · 1688 阅读 · 0 评论 -
python pandas.read_csv参数整理,读取txt,csv文件
pandas.read_csv参数整理 读取CSV(逗号分割)文件到DataFrame也支持文件的部分导入和选择迭代更多帮助参见:http://pandas.pydata.org/pandas-docs/stable/io.html参数:filepath_or_buffer : str,pathlib。str, pathlib.Path, py._path.local.Lo原创 2017-07-24 14:01:08 · 5214 阅读 · 0 评论 -
Python3 编码问题: 怎么将Unicode转中文,以及GBK乱码ÖйúÉÙÊýÃñ×åÌØÉ«´åÕ¯
原理:如果***type(text) is bytes***,那么text.decode('unicode_escape') 如果type(text) is str, 那么text.encode(‘latin1’).decode(‘unicode_escape’) 1. 案例:*#coding=utf-8import requests,re,json,traceback原创 2017-07-27 18:52:39 · 9394 阅读 · 3 评论 -
python 字典操作提取key,value
python 字典操作提取key,value dictionaryName[key] = value1.为字典增加一项 2.访问字典中的值 3、删除字典中的一项 4、遍历字典 5、字典遍历的key\value 6、字典的标准操作符 7、判断一个键是否在字典中 8、python中其他的一些字典方法 9、将两个字典合并 a={'a':1,...原创 2017-08-14 17:24:27 · 272111 阅读 · 2 评论 -
unicode中的‘\xa0’字符在转换成gbk编码时会出现问题,gbk无法转换'\xa0'字符。
unicode中的‘\xa0’字符在转换成gbk编码时会出现问题,gbk无法转换’\xa0’字符。 所以,在转换的时候必需进行一些前置动作:string.replace(u'\xa0', u' ') 将’\xa0‘替换成u’ ‘空格。原创 2017-08-21 18:24:14 · 1467 阅读 · 0 评论 -
Python生成词云图,TIIDF方法文本挖掘: 词频统计,词云图
python中使用wordcloud包生成的词云图。下面来介绍一下wordcloud包的基本用法。class wordcloud.WordCloud(font_path=None, width=400, height=200, margin=2, ranks_only=None, prefer_horizontal=0.9,mask=None, scale=1, color_func=None, m原创 2017-08-27 18:46:23 · 14672 阅读 · 0 评论 -
jieba(结巴)分词种词性简介
在做实际项目中,经常用到文本分析过程中的结巴分词功能,为了更好的得到结果,需要限定分词词性,接替可参见之间的博客: http://blog.youkuaiyun.com/hhtnan/article/details/76586693 在结巴分词限定的词性allowPOS 词性如何指定原创 2017-08-28 16:15:29 · 5207 阅读 · 1 评论 -
python 网页特征提取XPATH(两天玩转) 第一天
XPath 是一门在 XML 文档中查找信息的语言。XPath 用来在 XML 文档中对元素和属性进行遍历。关于xpath的说明文档可以参照:XPATH基础说明lxml用法源自 lxml python 官方文档,更多内容请直接参阅官方文档,本文对其进行翻译与整理。 官方英文版(lxml说明) 安装方法: pip install lxml 案例:百度百科词条为案例:明月镇词条 https:/原创 2017-08-23 18:42:36 · 10437 阅读 · 0 评论 -
Pycharm连接Github,下载上传管理与git bash 连接gitlab
怎么通过Pycharm连接Github,下载上传管理? Git&Pycharm心得:Pycharm是python开发IDE,GitHub是程序员的圣地.准备工作: git下载和安装要连接GitHub,首先git是必不可少的,git的安装的基本使用很简单,这里并不是讲git使用的教程,所以只是提一下就略过了. git 下载:https://git-scm.com/环境:pycharm 2016,G原创 2017-07-31 18:22:32 · 4803 阅读 · 0 评论 -
python 中输出字符的颜色控制属性 与控制输出间隔、小数点长度
在开发项目过程中,为了方便调试代码,经常会向stdout中输出一些日志,默认的这些日志就直接显示在了终端中。而一般的应用服务器,第三方库,甚至服务器的一些通告也会在终端中显示,这样就搅乱了我们想要的信息。书写格式,和相关说明如下: 1 格式:\033[显示方式;前景色;背景色m 2 3 说明: 4 前景色 背景色 颜色 5 -----------原创 2017-10-09 13:43:28 · 2512 阅读 · 0 评论