
Python数据分析
文章平均质量分 64
努力生活的黄先生
这个作者很懒,什么都没留下…
展开
-
python处理数据之xlwings库
文章目录xlwings基本结构创建一个app创建/打开一个books创建/打开一个sheet及相关操作xlwings处理数据获取数据写入数据动态获取范围numpy数组pandas数据框xlwings保存数据xlwingsxlwings和openpyxl类似,都是python操作excel的常用库。基本结构创建一个appimport xlwings as xw# visuble----创建一个app,将他展示出来# add_book---创建app时,是否创建一个工作簿app = x原创 2021-05-24 21:21:25 · 1650 阅读 · 0 评论 -
pandas分割、应用和组合(groupby)
文章目录groupby对象按列取值groupby对象可以按组迭代累计、过滤、转换和应用先导入包import numpy as npimport pandas as pdimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签plt.rcParams['axes.unicode_minus']=False #用来正常负号groupby对象df1 = pd.DataFram原创 2021-03-31 08:41:52 · 743 阅读 · 1 评论 -
pandas合并数据集
import numpy as npimport pandas as pddef make_df(col,ind): data = {c:[str(c) + str(i) for i in ind] for c in col} return pd.DataFrame(data, ind)#pd.concat()合并时,此方法不会处理索引相同的情况,直接合并为新的索引。#索引相同处理方法x = make_df('ab',[0,1])y = make_df('ab',[3,4].原创 2021-03-31 07:59:34 · 264 阅读 · 0 评论 -
pandas数值运算方法
pandas数值运算方法1、通用函数:保留索引:对Series或DataFrame对象使用numpy的通用函数时,返回的是保留索引的pandas对象2、通用函数:索引对齐:当两个Series或DataFrame对象进行二元计算时,pandas会在计算过程中自动,对齐两个对象的索引。1.Series索引对齐,结果输出的是,索引的并集,但是只有交集才有计算结果,其他返回为空,当然,也可以设置空值,添加fill_value参数,进行填补空值。若两个都是空值,则不进行填充(必须使用通用函数,例如ad原创 2021-03-31 07:19:48 · 2349 阅读 · 2 评论 -
pandas缺失值
文章目录pandas缺失值1、选择缺失值的方法:掩码和标签值2、pandas的缺失值3、None:python中的None对象4、NaN:数据类型的缺失值5、NaN和None的差异pandas处理缺失值pandas缺失值1、选择缺失值的方法:掩码和标签值掩码是一个与原数组维度相同的完整布尔类型数组/或者用用一个比特(0/1)表示有缺失值的局部状态标签值可能是具体的数值,也可能是一些极少出现的形式。还可能是一个更全局的值,比如NaN(不是一个数)表示缺失的浮点数2、pandas的缺失值pand原创 2021-03-31 07:18:50 · 1572 阅读 · 0 评论 -
Python正则表达式(re库)
正则表达式. —> 代表任意非换行\n符之外的任意字符[...] —> 字符集 例如:[A-Za-z0-9]{n} —> 重复前面字符n次。\d —> 匹配0-9 \D 匹配非数字\s —> 匹配空白 \S 匹配非空白\w ---->相当于[A-Za-z0-9_] \W 匹配非w* —>匹配前面字符0次或者无限次 若不确定要匹配的字符有没有,使用*+ —>匹配前面字符1次或者无限次原创 2021-03-31 07:18:21 · 427 阅读 · 0 评论 -
Python---random,time,PIL库
文章目录random库生成随机数字列表随机挑选元素time模块PIL类random库random.seed(a=None, version=2)设置随机种子,若不想让随机函数,有随机性,可以手动设置种子,以后每次随机出来的数字就会一样了生成随机数字random.randrange(stop)random.randrange(start, stop[, step])在range()中随机挑选一个数字。从 range(start, stop, step) 返回一个随机选择的元素。 这相当于 c原创 2021-03-30 08:12:01 · 322 阅读 · 1 评论 -
Python连接MongoDB,并进行操作
文章目录mongoDBpycharm连接mongo查增改删mongoDB其他限定符号mongoDBpycharm连接mongo# 导入pymongo包import pymongo# 连接数据库。host连接的域名,port连接端口。# 除此之外还可以直接将地址传进去db = pymongo.MongoClient(host='127.0.0.1',port='27017')# 进入text数据库text = db.text / text = db['text']# 进入fast数据表原创 2021-03-30 08:08:46 · 461 阅读 · 0 评论 -
Python操作文件方法
对文件操作os库import osos.getcwd() # 展示当前路径os.chdir() # 修改当前路径os.mkdir('./123') # 创建一级文件夹os.makedirs('./456/789') # 可以创建多级文件夹os.rmdir('') # 删除一个目录,文件夹中必须没有文件os.removedirs('') # 删除多个目录os.listdir('路径') # 展示此目录下所有的文件及文件夹os.path.isdir('路径') #判断是否为原创 2021-03-30 08:06:13 · 118 阅读 · 0 评论 -
Python常用方法(字符串、列表、map、filter等)
文章目录字符串方法元组列表定义方法切片字典定义方法集合高阶函数mapfiltersortedreduce匿名函数其他常用函数zip(list,list)enumerate(list/tuple)divmod(x,y)isinstance(obj,type)字符串方法方法描述capitalize()将字符串的第一个字符转换为大写center(width, fillchar)返回一个指定的宽度 width 居中的字符串,fillchar 为填充的字符,默认为空格。coun原创 2021-03-30 08:04:49 · 282 阅读 · 0 评论 -
Python错误和异常
文章目录错误和异常语法错误异常处理异常抛出异常raise异常判断assert用户自定义异常定义清理操作预定义的清理操作错误和异常语法错误解析错误,是因为不符合python语法。SyntaxError: invalid syntax异常即在语句和表达式在语法上是正确的,但是在执行时,它还是可能发生错误。这种执行中检测到的错误成为“异常”。错误信息的最后一行告诉我们程序遇到了什么类型的错误。处理异常可以编写处理所选异常的程序。try ... except....while True:原创 2021-03-30 07:58:53 · 170 阅读 · 0 评论 -
Python运算符、控制语句和函数
文章目录Python 运算符算术运算符Python 赋值运算符Python 比较运算符Python 逻辑运算符随机数函数Python 条件控制Python 循环语句Python函数可更改与不可更改对象参数必需参数关键字参数默认参数不定长参数匿名函数return语句Python 运算符算术运算符以下假设变量 a 为 10,变量 b 为 21:运算符描述实例+加–两个对象相加a+b 输出结果 31-减–两个对象相减a-b 输出结果 -11*乘–两个对象相乘原创 2021-03-30 07:56:32 · 231 阅读 · 0 评论 -
pyhton基本数据类型
文章目录Python基本数据类型Number(数字)String(字符串)List(列表)将列表当做堆栈使用Tuple(元组)Set(集合)Dictionary(字典)Python 数据类型转换Python基本数据类型Python 中的变量不需要声明。每个变量在使用前都必须赋值,变量赋值以后该变量才会被创建。在 Python 中,变量就是变量,它没有类型,我们所说的"类型"是变量所指的内存中对象的类型。del 语句可以删除列表的元素,不能删除元组的元素。但是可以删除整个元组Number(数字)原创 2021-03-30 07:52:22 · 426 阅读 · 0 评论 -
python爬虫、文件读取和写出
文章目录Python爬虫xpath 方法正则表达式法1、导入模板2、确定 URL3、访问 URL 并获得响应4、解析页面,获得需要的数据5、将获得的内容进行整理代码Python 打开文件、读取文件、写入文档Python爬虫xpath 方法需要导入 requests 包、lxml 包(第三方包需要下载)from lxml import etreeheaders 是模拟实际用户进行访问网站,查询自己电脑的方法进入 http://httpbin.org/get,找到 User-Agent 一栏就是了。原创 2021-03-30 07:49:02 · 1201 阅读 · 0 评论 -
python画笔和词云分析
文章目录python画笔Python词云分析导入 wordcloud 包中文词解绘制特定形状的词云代码python画笔使用前需要导入 turtle 包—import turtle函数描述Pen()turtle.Pen()创建一个窗口(拿起一个笔)up()turtle.up()拿起画笔down()turtle.down()放下画笔forward()turtle.forward(self)向前移动 self 个像素right()turtle.righ原创 2021-03-30 07:43:37 · 464 阅读 · 0 评论