
python基础
python基础知识
逍遥_yjz
主要从事文本处理,实体识别方向;攻读自然语言处理,深度学习。
展开
-
Python关于编码访问、修改、转换
1.首先判断数据是什么编码格式:import chardetb = '你好'print chardet.detect(b)#{'confidence': 0.7525, 'encoding': 'utf-8'}2.怎么判断数据是这个编码格式的时候,做出对应的处理:def testUnicode(): print '编码问题' a = 'wer' b = '你好' ...原创 2018-04-07 20:34:33 · 216 阅读 · 0 评论 -
unicode的编码转换成中文的list
#unicode的编码转换成中文的listdef testUnicodeToChineseList(all_symptom): str_symptom = str(all_symptom).replace('u\'', '\'') return str_symptom.decode("unicode-escape")打印集合查看元素,调用函数。print s.keywor原创 2017-09-13 11:14:36 · 2236 阅读 · 0 评论 -
python3.5 读取文本文件出现乱码
1.读取文本文件出现乱码1.1 python2.7首先,在Python2.7的里面只要设置和编码,读取文本是没有问题的:# -*- coding:utf-8 -*-import sysreload(sys)sys.setdefaultencoding("utf-8")一般我们用Python2.7,保证输出中文,以上就已经搞定啦。 例子:# -*- coding:原创 2018-07-09 11:44:05 · 79 阅读 · 1 评论 -
python 判断文件是否存在以及
def test1(): #判断文件夹是否存在: if os.path.exists(r'D:\PythonFiles\CINS\traindata\2016103000.news_zhengwen'): print 'true' else: print 'false'#test1()#整数转换字符串def test2():原创 2017-07-12 20:28:01 · 2408 阅读 · 0 评论 -
[Python]随机数与随机字符串
随机整数:>>> import random>>> random.randint(0,99)21随机选取0到100间的偶数:>>> import random>>> random.randrange(0, 101, 2)42随机浮点数:>>> import random>>> random.random() 0.85415370477785668>>> rand原创 2017-05-25 23:02:48 · 271 阅读 · 0 评论 -
Python的并列和或者条件
对Python 同时符合两个的条件的语句,用and连接,不能用&&(会报错);也可以用or表示或者。代码如下:print '开始测试' a = 12 b = 13 c = 1 a_s = '12' b_s = '13' if a < b and a_s < b_s: print 'True' else:原创 2017-06-29 16:44:36 · 99411 阅读 · 2 评论 -
python 清新脏数据
调取文本数据,清洗后写入文本# -*- coding: utf-8 -*-#!/usr/bin/env pythonimport sysimport reimport jsonimport xlwtimport xlrdfrom xlutils.copy import copyreload(sys)sys.setdefaultencoding('utf-8')#...原创 2017-07-12 19:54:04 · 955 阅读 · 0 评论 -
Python的collections模块中的OrderedDict有序字典
排序实现:import collectionsdef numOfRepeat(numOfList,numOfSet): d = collections.OrderedDict() for i in numOfSet: count = 0 for j in numOfList: if i == j:原创 2017-07-12 22:18:18 · 2954 阅读 · 0 评论 -
python os.path模块(os.listdir和os._exit())
1.python os fileList = os.listdir(path) if len(fileList) == 0: print 'The folder is empty' os._exit() #直接退出 Python程序,其后的代码也不会继续执行。 for file in fileList: if not o原创 2017-11-22 17:00:22 · 2265 阅读 · 0 评论 -
python datatime操作
1.datatime 的访问。2. datatime 与字符串之间的转换。3.随机字符串的生成。now = datetime.now() print now # 2017-05-25 22:56:46.066000 # datetime 转换为 str tiem=now.strftime( "%Y-%m-%d %H:%M:%S") print tiem # ...原创 2018-04-07 20:38:49 · 990 阅读 · 0 评论 -
jieba 去除停用词、提取关键词、词性标注
#-*- coding:utf-8 -*-import sysimport jiebaimport osimport jieba.analyseimport stringimport mathimport jsonreload(sys)sys.setdefaultencoding('utf-8')topk=10testGuanJian = open(r'D:\Py...原创 2018-04-07 20:42:25 · 10069 阅读 · 0 评论 -
python 判断列表中每个元素有几个
使用标准库提供的collections基本用法:import collectionslst = [] # lst存放所谓的100万个元素d = collections.Counter(lst)# 瞬间出结果for k in d: # k是lst中的每个元素 # d[k]是k在lst中出现的次数...原创 2018-04-07 20:53:43 · 6613 阅读 · 0 评论 -
python 更新插入mySQL数据库
#-*- coding:utf-8 -*-import sysimport mysql.connectorimport chardetimport datetimeimport codecsreload(sys)sys.setdefaultencoding('utf-8')collection_status =0created_time = datetime.datetim...原创 2018-04-07 20:55:47 · 4376 阅读 · 0 评论 -
python3 陌生的角落(1):基础语法
1.Print 输出python2 替换空格 , Python3 用end = “”。print 默认输出是换行的,如果要实现不换行需要在变量末尾加上 end=”“:#!/usr/bin/python3x="a"y="b"# 换行输出print( x )print( y )print('---------')# 不换行输出print( x, end=" " )pr...原创 2018-04-22 20:15:51 · 351 阅读 · 0 评论 -
python3 陌生的角落(2):各种类型
1.数学函数函数 返回值 ( 描述 ) abs(x) 返回数字的绝对值,如abs(-10) 返回 10 ceil(x) 返回数字的上入整数,如math.ceil(4.1) 返回 5cmp(x, y) 如果 x < y 返回 -1, 如果 x == y 返回 0, 如果 x > y 返回 1,Python 3 已废弃 , 使用 (x>y...原创 2018-04-22 20:24:28 · 188 阅读 · 0 评论 -
python3 陌生的角落(3):条件、迭代、模块、文件输入输出
1.print() sep 参数使用>>> a=10;b=388;c=98>>> print(a,b,c,sep='@')10@388@982.while 循环使用 else 语句在 while … else 在条件语句为 false 时执行 else 的语句块:实例#!/usr/bin/python3count = 0w...原创 2018-04-24 15:35:16 · 364 阅读 · 0 评论 -
python3 陌生的角落(4):OS与错误异常
1.OS 文件/目录方法(1)os.chdir()和os.getcwd() 方法用于改变当前工作目录到指定的路径。os.chdir(path)参数path – 要切换到的新路径。返回值 如果允许访问返回 True , 否则返回False。 实例#!/usr/bin/python3import os, syspath = "/tmp"# ...原创 2018-04-24 22:26:50 · 519 阅读 · 0 评论 -
python3 陌生的角落(5):标准库概览、年龄
1.操作系统接口 os.system('mkdir today') # 执行系统命令 mkdir 针对日常的文件和目录管理任务,:mod:shutil 模块提供了一个易于使用的高级接口:&gt;&gt;&gt; import shutil&gt;&gt;&gt; shutil.copyfile('data.db', 'archive.db')&gt;&g原创 2018-04-25 11:52:49 · 213 阅读 · 0 评论 -
python3 陌生的角落(6):开方、大小写转换和日期
1.开平方num = float(input('请输入一个数字: '))num_sqrt = num ** 0.5print(' %0.3f 的平方根为 %0.3f'%(num ,num_sqrt))2.生成日历# 引入日历模块import calendar# 输入指定年月yy = int(input("输入年份: "))mm = int(input("输入月...原创 2018-04-25 16:34:59 · 575 阅读 · 0 评论 -
python3 陌生的角落(7):正则表达式
1.re.match函数re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。re.match(pattern, string, flags=0)import reprint(re.match('www', 'www.runoob.com').span()) # 在起始位置匹配print(re.match('co...原创 2018-04-25 21:15:53 · 285 阅读 · 0 评论 -
python3 陌生的角落(8):MySQL 数据库连接
#-*- coding:utf-8 -*-import sysimport mysql.connectorimport chardetreload(sys)sys.setdefaultencoding('utf-8')#连接mysql数据库def testMySqlDatabase(): print 'mysql数据库' conn = mysql.connec...原创 2018-04-25 21:24:22 · 165 阅读 · 0 评论 -
python3 陌生的角落(9):JSON 数据解析
JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式。它基于ECMAScript的一个子集。 Python3 中可以使用 json 模块来对 JSON 数据进行编解码,它包含了两个函数:json.dumps(): 对数据进行编码。json.loads(): 对数据进行解码。在json的编解码过程中,python 的原始类型与json类型会相...原创 2018-04-25 21:58:32 · 273 阅读 · 0 评论 -
Random的使用
随机函数的使用,且不重复的使用旧数据的技巧from numpy import *dataIndex = range(20)print dataIndex #[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19]randIndex = int(random.uniform(0,len(dataIndex)...原创 2018-05-13 20:54:50 · 243 阅读 · 0 评论 -
Python 面向对象和类
1.类和对象类(Class): 用来描述具有相同的属性和方法的对象的集合。它定义了该集合中每个对象所共有的属性和方法。对象是类的实例。对象:通过类定义的数据结构实例。对象包括两个数据成员(类变量和实例变量)和方法。 面向对象:是把数据和方法结合起来,进行了分装。1.1 类打个比方,类好似玩具的模子,对象就是模子刻画出的玩具。 类包含:类的名称:类名类的属性:一组数据...原创 2018-05-15 16:08:04 · 1988 阅读 · 0 评论