
code
文章平均质量分 90
mintminty
这个作者很懒,什么都没留下…
展开
-
Datawhale组队学习(Pandas) task11-综合练习
任务4 显卡日志最开始想要通过str.extract(pat)提取有用信息,然后长宽表变换得到答案的,后来在实践过程中并没有实现,于是 解答该题思路转化为:每一条测试都是两行,首先我将奇数行/偶数行分别存储偶数行提取状态、精度、模型信息奇数行提取模型、时间信息本来最开始思路是根据模型 merge两个结果的,后来突然发现不同模型对应不同状态、精度,于是索性根据默认的索引直接拼接了# 提取有用信息行data = pd.read_table('./data/test/benchmark.txt原创 2021-01-13 20:05:13 · 226 阅读 · 1 评论 -
Datawhale组队学习(Pandas) task10-时序数据
时间戳单独时间点即为时间戳,pandas中称为Timestamp,一系列时间戳可以组成DatetimeIndexTimestamp的构造与属性import numpy as npimport pandas as pdts = pd.Timestamp('2020-1-1 08:10:30')tsTimestamp('2020-01-01 08:10:30')# 通过 year, month, day, hour, min, second 可以获取具体的数值ts.year # 20原创 2021-01-10 21:03:03 · 262 阅读 · 0 评论 -
Datawhale组队学习(Pandas) task9-分类数据
第九章 分类数据import numpy as npimport pandas as pdcat对象cat对象的属性category类型,处理分类类型变量,将普通序列转化成分类变量可使用astype方法df = pd.read_csv('data/learn_pandas.csv',usecols=['Grade', 'Name', 'Gender', 'Height', 'Weight'])df.head() Grade Nam原创 2021-01-07 21:40:57 · 280 阅读 · 0 评论 -
Datawhale组队学习(Pandas) task8-文本数据
第八章 文本数据目录1. str对象2. 正则表达式基础3. 文本处理的五类操作3.1 拆分3.2 合并3.3 匹配3.4 替换3.4 提取4. 常用字符串函数4.1 字母型函数4.2 数值型函数4.3 统计型函数4.4 格式型函数5. 练一练Ex1:房屋信息数据集Ex2:《权力的游戏》剧本数据集1. str对象import numpy as npimport pandas as pdvar = 'abcd'str.upper(var)'ABCD's = pd.Series(['0ab原创 2021-01-06 11:24:41 · 264 阅读 · 0 评论 -
Datawhale组队学习(Pandas) task7-缺失数据
缺失值的统计和删除缺失信息的统计# 查看每个单元格是否有缺失 isna()或isnull()df = pd.read_csv('data/learn_pandas.csv',usecols=['Grade', 'Name', 'Gender', 'Height','Weight', 'Transfer'])df.isna().head() Grade Name Gender Height Weight原创 2021-01-03 17:59:39 · 246 阅读 · 2 评论 -
Task Special & Task 11 综合练习
Task Special & Task 11 综合练习任务一 企业收入的多样性import pandas as pdimport numpy as npdf1 = pd.read_csv('./data/test_1/Company.csv')df2 = pd.read_csv('./data/test_1/Company_data.csv')###### 处理df2 ####### 从日期列中分割出年份df2['年份'] = [x.split('/')[0] for x in原创 2021-01-01 11:32:31 · 267 阅读 · 1 评论 -
Datawhale组队学习(Pandas) task6-连接
第六章 连接目录1. 关系型连接1.1 连接基本概念1.2 值连接1.3 索引连接2. 方向连接2.1 concat2.2 序列与表的合并3. 类连接操作3.1 比较3.2 组合Ex1:美国疫情数据集Ex2:实现join函数1. 关系型连接1.1 连接基本概念将两张相关的表按照某一个或某一组键连接起来,关键要素是键和连接形式,其中连接形式包含:左连接 left:以左边的键为准,若右表中的键 出现于左表,则将改键添加到左表。否则处理为缺失值。右连接 right:类似处理内连接 inner:.原创 2020-12-29 19:04:37 · 259 阅读 · 0 评论 -
Datawhale组队学习(Pandas) task5-变形
Joyful Pandas 第五章 变形练习1 美国非法药物数据集我的思路# 1. 考察长表变宽表的知识点df = pd.read_csv('data/drugs.csv').sort_values(['State','COUNTY','SubstanceName'],ignore_index=True)df_pivot = df.pivot(index=['State','COUNTY','SubstanceName'],columns='YYYY',values='DrugReports'原创 2020-12-27 23:39:10 · 257 阅读 · 2 评论 -
Datawhale组队学习(Pandas) task4-分组
练习1:汽车数据集1-1:先过滤出所属 Country 数超过2个的汽车,即若该汽车的 Country 在总体数据集中出现次数不超过2则剔除,再按 Country 分组计算价格均值、价格变异系数、该 Country 的汽车数量,其中变异系数的计算方法是标准差除以均值,并在结果中把变异系数重命名为 CoV 。我的答案gb = df.groupby('Country')index_list = gb.filter(lambda x:x.shape[0]<=2).indexdf_drop =原创 2020-12-25 20:23:27 · 450 阅读 · 4 评论 -
Datawhale组队学习(Pandas) task2-pandas基础
写在前面看了很多小伙伴task1的笔记,感觉很棒的同时也深受启发,学习过程不仅仅是教材等资料的理解和重复,更应该是自己的思考、串联、发问、尝试,这样才能学得深刻~ 但因为前者更容易,所以自己常常陷入那种效率不太高的努力陷阱中。那以后的打卡笔记就不做一个搬运工+补充工了,多记录自己的思考和尝试。import numpy as npimport pandas as pdpd.__version__'1.1.5'1. 文件读取和写入1.1 文件读取1.1.1 读取my_csv, my_tab原创 2020-12-19 20:29:38 · 451 阅读 · 6 评论 -
Datawhale组队学习(Pandas) task1-预备知识
【1】第20期 学习者手册(Pandas)【2】第一章 预备知识1. Python 基础1.1 列表推导式与条件赋值问题1:生成 [0, 2, 4, 6, 8] 样式的数字序列写法1:定义函数+循环def my_func(x): return x*2list = []for i in range(5): list.append(my_func(i)) print(list)写法2:定义函数+列表推导式list = [my_func(i) for i原创 2020-12-14 09:47:04 · 263 阅读 · 0 评论 -
leetcode数组类
按这篇文章顺序刷题:有没有人一起从零开始刷力扣 ,本系列博客记录刷题中的知识点,坚持做题和总结~(ง •_•)ง一、数组的遍历题目1:414# 解题思路:# 1. 去重# 2. 小于3位数,返回最大值# 3. 大于等于2位数,返回第三大的数class Solution: def thirdMax(self, nums: List[int]) -> int: new = set(nums) if len(new)<3:原创 2020-08-03 20:45:53 · 245 阅读 · 0 评论