
pandas
文章平均质量分 85
可以叫我才哥
关注我的公众号呗,一起学习
微信公众号:可以叫我才哥
展开
-
答疑解惑:用pandas的shift函数解决一个数据处理问题
大家好,我是才哥。 本系列将用于记录在日常中遇到的一些问题的答疑解惑,这些问题可能来自咱们可爱的粉丝又或者来自咱自己。行文会比较间接,解决方案不一定最优,欢迎大家交流~ 让我们正式开始吧! 今天有个粉丝问了一个Pandas的数据处理问题,似曾相似,咱们一起看看吧! df,有name,job两列, 筛选条件,job=0,并且这行name和上一行(前值)不同 把符合条件行的job从0改为1 我们就基于自己的思路,自己构建模拟数据直接开干了! In [1]: import pandas as pd In原创 2021-09-16 21:23:46 · 392 阅读 · 0 评论 -
实战|用Python爬取《云南虫谷》3.6万条评论,并做数据统计可视化展示分析,好看!
大家好,我是才哥。 最近鬼吹灯系列网剧《云南虫谷》上线,作为鬼吹灯系列作品,承接上部《龙岭迷窟》内容,且还是铁三角原班人马主演,网友直呼非常好看! 今天,我们就用Python爬取目前全部剧集的评论(含预告片),并做数据统计与可视化展示分析,一起跟着网友看看这部剧吧! 本文将详细讲解爬虫与数据处理可视化,寓教于乐! 后台回复 210905 领取 代码+数据 目录: 文章目录1. 网页分析2. 爬虫过程2.1. 引入需要的库2.2. 爬取剧集页面数据2.3. 解析剧集ID和剧集评论ID2.4. 采集全部剧集评论原创 2021-09-05 18:01:39 · 692 阅读 · 3 评论 -
只需8招,搞定Pandas数据筛选与查询
大家好,我是才哥。 今天聊聊Pandas数据筛选与查询的一些操作,在数据分析的过程中通常要对数据进行清洗与处理,而其中比较重要和常见的操作就有对数据进行筛选与查询。 目录: 文章目录1. 案例数据预览2. 基础操作2.1. 切片[]2.2. 索引选择.iloc与.loc2.3. 元素选择.iat与.at2.4. get与truncate3. 进阶操作3.1. 逻辑筛选3.2. 函数筛选3.3. query3.4. filter 1. 案例数据预览 本次案例,我们继续采用之前用到过的各地区GDP数据,数据信原创 2021-09-02 16:59:54 · 1416 阅读 · 0 评论 -
对比Excel,用Pandas轻松搞定IF函数操作(df.where与df.mask)
大家好,我是才哥。 在 Excel 中IF 函数是最常用的函数之一,它可以对值和期待值进行逻辑比较。 因此IF 语句可能有两个结果: 第一个结果是比较结果为 True,第二个结果是比较结果为 False。 例如,=IF(C2=”Yes”,1,2) 表示 IF(C2 = Yes, 则返回 1, 否则返回 2)。 那么,在Pandas里我们可以怎么来轻松搞定这一操作呢? 今天,我们就来了解一下! 目录: 文章目录1. 案例需求2. Excel轻松搞定3. Pandas处理4. 延伸 1. 案例需求 原始数据如下原创 2021-09-02 16:59:17 · 4694 阅读 · 2 评论 -
一看就会的Pandas文本数据处理
大家好,我是才哥。 日常工作中我们经常接触到一些文本类信息,需要从文本中解析出数据信息,然后再进行数据分析操作。 而对文本类信息进行解析是一件比较头秃的事情,好巧,Pandas刚好对这类文本数据有比较好的处理方法,那就让我们来一起学一学吧! 1. 文本数据类型 在pandas中存储文本数据有两种方式:object 和 string。在pandas 1.0版本之前,object是唯一的文本类型,在一列数据中如果包含数值和文本等混合类型则一般也会默认为object。在pandas 1.0 版本之后,新增了str原创 2021-08-08 21:42:34 · 1288 阅读 · 19 评论 -
对比Excel,一文掌握Pandas表格条件格式(可视化)
大家好,我是才哥。 本来这周不是加班周,但是毕竟项目赶进度,还是需要加班着,咱们更文又变得慢了起来。 最近有粉丝询问Pandas表格可视化的一些问题,刚好前段时间也看过,那么就结合之前处理Excel时的条件格式对着来看吧。 所以,今天咱们隆重介绍一下Excel条件格式与Pandas的表格可视化,走起! 目录: 文章目录1. 概述2. 突出显示单元格2.1. 高亮缺失值2.2. 高亮最大值2.3. 高亮最小值2.4. 高亮区间值2.5. 高亮分位数3. 色阶(背景及文本渐变色)3.1. 背景渐变色3.2. 文原创 2021-08-07 12:07:48 · 759 阅读 · 0 评论