Pandas
文章平均质量分 94
pandas
Gocara
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Pandas 12-综合练习2
Pandas 12-综合练习2import numpy as npimport pandas as pd【任务五】显卡日志下面给出了3090显卡的性能测评日志结果,每一条日志有如下结构:Benchmarking #2# #4# precision type #1##1# model average #2# time : #3# ms其中#1#代表的是模型名称,#2#的值为train(ing)或inference,表示训练状态或推断状态,#3#表示耗时,#4#表示精度,其中包含了flo原创 2021-01-13 23:23:04 · 306 阅读 · 0 评论 -
Pandas 10-时序数据
Pandas 10-时序数据import numpy as npimport pandas as pd一、时序中的基本对象时间序列的概念在日常生活中十分常见,但对于一个具体的时序事件而言,可以从多个时间对象的角度来描述。例如2020年9月7日周一早上8点整需要到教室上课,这个课会在当天早上10点结束,其中包含了哪些时间概念?第一,会出现时间戳(Date times)的概念,即’2020-9-7 08:00:00’和’2020-9-7 10:00:00’这两个时间点分别代表了上课和下课的时刻,原创 2021-01-09 21:21:46 · 728 阅读 · 0 评论 -
Pandas 09-分类数据
Pandas 09-分类数据import numpy as npimport pandas as pd一、cat对象1. cat对象的属性在pandas中提供了category类型,使用户能够处理分类类型的变量,将一个普通序列转换成分类变量可以使用astype方法。df = pd.read_csv('../data/learn_pandas.csv', usecols = ['Grade', 'Name', 'Gender', 'Height', 'Weight'])s = df.Grade原创 2021-01-07 12:15:20 · 328 阅读 · 0 评论 -
Pandas 08-文本数据
Pandas 08-文本数据import numpy as npimport pandas as pd一、str对象1. str对象的设计意图str对象是定义在Index或Series上的属性,专门用于逐元素处理文本内容,其内部定义了大量方法,因此对一个序列进行文本处理,首先需要获取其str对象。在Python标准库中也有str模块,为了使用上的便利,有许多函数的用法pandas照搬了它的设计,例如字母转为大写的操作:var = 'abcd'str.upper(var) # Python内置原创 2021-01-05 09:51:44 · 254 阅读 · 0 评论 -
Pandas 07-缺失数据
Pandas 07-缺失数据import numpy as npimport pandas as pd一、缺失值的统计和删除1. 缺失信息的统计缺失数据可以使用isna或isnull(两个函数没有区别)来查看每个单元格是否缺失,通过和sum的组合可以计算出每列缺失值的比例:df = pd.read_csv('../data/learn_pandas.csv', usecols = ['Grade', 'Name', 'Gender', 'Height', 'Weight', 'Transfer原创 2021-01-03 07:04:48 · 290 阅读 · 0 评论 -
Pandas 11-综合练习
Pandas 11-综合练习 import pandas as pdimport numpy as npnp.seterr(all = 'ignore'){'divide': 'ignore', 'over': 'ignore', 'under': 'ignore', 'invalid': 'ignore'}【任务一】企业收入的多样性【题目描述】一个企业的产业收入多样性可以仿照信息熵的概念来定义收入熵指标 :I=−∑ip(xi)log(p(xi))I=-\sum_i{p(x_i)log(p原创 2021-01-01 08:38:17 · 2696 阅读 · 3 评论 -
Pandas 06-连接
Pandas 06-连接import numpy as npimport pandas as pd一、关系型连接1. 连接的基本概念把两张相关的表按照某一个或某一组键连接起来是一种常见操作,例如学生期末考试各个科目的成绩表按照姓名\color{red}{姓名}姓名和班级\color{red}{班级}班级连接成总的成绩表,又例如对企业员工的各类信息表按照员工ID号\color{red}{员工ID号}员工ID号进行连接汇总。由此可以看出,在关系型连接中,键\color{red}{键}键是十分重要的,原创 2020-12-29 01:47:05 · 308 阅读 · 0 评论 -
pandas 05-变形
Pandas 05-变形import numpy as npimport pandas as pd一、长宽表的变形什么是长表?什么是宽表?这个概念是对于某一个特征而言的。例如:一个表中把性别存储在某一个列中,那么它就是关于性别的长表;如果把性别作为列名,列中的元素是某一其他的相关特征数值,那么这个表是关于性别的宽表。下面的两张表就分别是关于性别的长表和宽表:pd.DataFrame({'Gender':['F','F','M','M'], 'Height':[163, 160, 175, 180原创 2020-12-27 02:09:40 · 1295 阅读 · 0 评论 -
Pandas 04-分组
pandas 分组import numpy as npimport pandas as pd一、分组模式及其对象1. 分组的一般模式分组操作在日常生活中使用极其广泛,例如:依据性别\color{#FF0000}{性别}性别分组,统计全国人口寿命\color{#00FF00}{寿命}寿命的平均值\color{#0000FF}{平均值}平均值依据季节\color{#FF0000}{季节}季节分组,对每一个季节的温度\color{#00FF00}{温度}温度进行组内标准化\color{#0000原创 2020-12-23 18:20:36 · 1505 阅读 · 3 评论 -
Pandas 03-索引
Pandas 03-索引import numpy as npimport pandas as pd一、索引器1. 表的列索引列索引是最常见的索引形式,一般通过[]来实现。通过[列名]可以从DataFrame中取出相应的列,返回值为Series,例如从表中取出姓名一列:df = pd.read_csv('../data/learn_pandas.csv', usecols = ['School', 'Grade', 'Name', 'Gender', 'Weight', 'Transfer'])原创 2020-12-21 07:45:20 · 555 阅读 · 1 评论 -
Pandas 02-基础
Pandas 02-基础import numpy as npimport pandas as pdpd.__version__'1.1.5'在开始学习前,请保证 pandas 的版本号不低于1.1.4,否则请务必升级!一、文件的读取和写入1. 文件读取pandas可以读取的文件格式有很多,这里主要介绍读取csv, excel, txt文件。df_csv = pd.read_csv('../data/my_csv.csv')df_csv原创 2020-12-19 00:32:36 · 1008 阅读 · 4 评论 -
Pandas 01-预备知识
Pandas 01-预备知识一、Python基础1. 列表推导式与条件赋值在生成一个数字序列的时候,在Python中可以如下写出:L = []def my_func(x): return 2*xfor i in range(5): L.append(my_func(i))L[0, 2, 4, 6, 8]事实上可以利用列表推导式进行写法上的简化:[* for i in *]。其中,第一个*为映射函数,其输入为后面i指代的内容,第二个*表示迭代的对象。[my_func(i原创 2020-12-15 06:35:06 · 482 阅读 · 2 评论
分享