【Python有趣打卡】利用pandas完成数据分析项目（一）

最新推荐文章于 2025-10-11 11:07:19 发布

原创

最新推荐文章于 2025-10-11 11:07:19 发布 · 4.3k 阅读

54 ·

CC 4.0 BY-SA版权

本文介绍了使用pandas进行数据分析的项目，通过Kaggle上的星巴克店铺数据，探讨了全球及中国星巴克店铺的分布情况，包括处理缺失值、异常值，以及通过可视化展示各国和各城市店铺数量。

【Python有趣打卡】数据分析pandas完成数据分析项目

今天依然是跟着罗罗攀学习数据分析，原创：罗罗攀（公众号：luoluopan1）学习Python有趣|数据分析三板斧。今天是在DD大数据团队实习的第一天，正式开始数据分析之旅，很开心，感觉离自己的梦想又进了一步~

数据源

数据来源
https://www.kaggle.com/starbucks/store-locations （数据下载需要注册）
定义问题
哪些国家星巴克店铺较多；哪些城市星巴克店铺较多；中国星巴克店铺分布情况
读取数据

import numpy as np
import pandas as pd
data = pd.read_csv(r'C:\Users\xuxiaojielucky_i\Desktop\directory.csv')
data.head()

还是使用jupyter notebook
在这里插入图片描述

查看数据

检查数据

data.describe()

describe函数主要是用来了解数值型数据的分布和概况
在这里插入图片描述

data.info()

info函数主要是用来查看数据的缺失值情况，如针对我们的问题，我们关注的数据主要是地点（国家和城市），这里城市city部分数据缺失。

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

xxjcyh

关注关注

5
点赞
踩
54

收藏

觉得还不错? 一键收藏
3
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

利用Pandas库进行简单的数据分析（数据清洗）

MaRin0709的博客

01-30

720

Pandas练习3练习题练习1练习2练习1代码效果图练习2代码效果图小结练习题练习1 练习2 练习1 代码 import pandas as pd import numpy as np # Exercise 1 # 读取北向.csv 指定 trade_date 为行索引 data_north = pd.read_csv("北向.csv", index_col="trade_date") print("读取后的数据为:") print(data_north) print() # 查看数据的基本

Python数据分析：pandas数据操作和分析案例

厚积薄发

04-29

5481

Python数据分析：pandas数据操作和分析案例项目介绍： https://www.kaggle.com/openfoodfacts/world-food-facts 项目任务：统计各个国家食物中的食品添加剂种类个数 import zipfile import os import pandas as pd import matplotlib.pyplot as plt def ...

3 条评论您还未登录，请先登录后发表或查看评论

python数据分析实例-Python数据分析pandas模块用法实例详解

weixin_37988176的博客

10-29

400

本文实例讲述了Python数据分析pandas模块用法。分享给大家供大家参考，具体如下：pandaspandas10分钟入门，可以查看官网：10 minutes to pandas也可以查看更复杂的cookbookpandas是非常强大的数据分析包，pandas 是基于 Numpy 构建的含有更高级数据结构和工具的数据分析包。就好比 Numpy的核心是 ndarray，pandas 围绕着 Ser...

Python高效处理Excel文件的12个Pandas函数

最新发布

2301_78217634的博客

10-11

1024

Pandas是Python中处理Excel文件的强大工具，下面我将详细介绍12个最常用的高效处理Excel文件的Pandas函数，并提供代码演示。

机器学习之pandas库②——小项目实战②

门前大橋下丶

08-07

1752

分析(共享单车使用量项目) 数据集下载(http://archive.ics.uci.edu/ml/datasets/Bike+Sharing+Dataset) 数据集信息：自行车共享系统是新一代的传统自行车租赁，其中会员，租赁和退货的整个过程已经自动化。通过这些系统，用户能够从特定位置轻松地租用自行车并在另一个位置返回。目前，全世界约有500多个自行车共享计划，其中包括超过50万辆自行车。今天...

python神器pandas_Python Pandas数据分析工具用法实例

weixin_39758953的博客

12-08

219

1、介绍Pandas是基于Numpy的专业数据分析工具，可以灵活高效的处理各种数据集，也是我们后期分析案例的神器。它提供了两种类型的数据结构，分别是DataFrame和Series，我们可以简单粗暴的把DataFrame理解为Excel里面的一张表，而Series就是表中的某一列2、创建DataFrame# -*- encoding=utf-8 -*-import pandasif __name_...

Python打卡第二天——Pandas简介数据类型及数据处理

m0_45434809的博客

02-19

1345

1、DataFrame：二维的表格型数据结构,可以理解为Series的容器，通俗地说，就是可以把Series放到DataFrame里面，它是一种二维表格型数据的结构，既有行索引，也有列索引。在 agg()函数里应用聚合函数计算结果，如 sum()、mean()、count()、max()、min()等，用于对每个分组进行聚合计算。Pandas作为Python数据分析的核心包，提供了大量的数据分析函数，可以用于数据处理、数据抽取、数据集成、数据计算等基本的数据分析手段。先分组：根据某列数据的值进行分组。

数据分析pandas完成数据分析项目

weixin_51463905的博客

06-29

550

【Python有趣打卡】数据分析pandas完成数据分析项目 ![](https://img-blog.csdnimg.cn/20190306201535208.png?x-oss- process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl8zNzg4ODk1OA==,size_16,color_FFFFFF,t_70) 今天依然是跟着罗罗攀学习数据分析，原创：

（八）Pandas窗口数据与数据读写学习简要笔记 #Python #CDA学习打卡

weixin_42346952的博客

04-18

1401

本文介绍了Pandas窗口数据（滚动计算函数）以及数据读写形式（CSV、Excel、HDF、SQL）

（五）Pandas数据重塑学习简要笔记 #Python #CDA学习打卡

weixin_42346952的博客

04-11

841

本文介绍了数据重塑的6种方法（堆叠stack、拆堆unstack、透视pivot、融合melt、透视表pivot table、交叉表crosstab）。

Pandas数据分析实战项目(简单)

热门推荐

初一的博客

06-27

1万+

一、项目介绍项目背景：根据已有数据，对给定车型进行数据分析，得出给定车型近半年每个月在各个城市真实搜索指数数据来源：数据使用百度指数给出的数据，通过对给定车型关键词进行数据抓取，得到车型的全国搜索指数。省份搜索热度、城市搜索热度。二、项目处理 1、处理全国指数趋势表打开百度指数趋势表，发现有如下问题需要处理：对于个别车型是近期才有数据，之前没有数据，需要对缺失值进行处理；结果是...

Pandas学习项目练习数据集-数据集

04-01

Pandas学习项目练习数据集-数据集

pandas 实践数据-数据集

03-28

pandas金融实战

04-22

书籍通俗易懂的介绍了如何利用pandas进行股票操作、金融套利

pandas入门实践教程--二十分钟轻松搞定

12-03

从 pandas的实践操作触发：数据读取、数据清洗、数据计算、数据存储

【python】pandas模块数据处理小案例

weixin_46429290的博客

03-21

759

pandas作为数据处理的得力工具，简便了数据开发过程，之前串联了pandas的使用方法，现在用几个小案例巩固一下常用的pandas方法。数据缺少日期，为了模拟数据，需要对每行数据增加一个随机日期，要求：日期范围在2023-01-01 至 2023-01-15之间。假设一行数据如上所示，分别为页面、点击、添加、支付、花费等字段，那么需要实现的功能如下。要求：每个页面的总共点击、添加、支付、花费总量按照点击、添加、支付、花费排序。要求：按照page字段聚合，求click、add、pay的和。

不容忽视的30个数据可视化小技巧

尤尔小屋

01-12

1680

公众号：尤而小屋作者：Peter编辑：Peter 大家好，我是Peter~ 写过很多关于Pandas的文章，本文开展了一个简单的综合使用，主要分为：如何自行模拟数据多种数据处理方式数据统计与可视化用户RFM模型用户复购周期构建数据本案例中用的数据是小编自行模拟的，主要包含两个数据：订单数据和水果信息数据，并且会将两份数据合并 import pandas as pd import numpy as np import random from datetime import * imp.

小项目-数据处理篇：pandas进行工作相关数据清洗

泛泛之素

01-01

4497

1、去重工作地址，获取地址坐标（高德） 2、去重公司，获取公司情况 3、工作筛选，由于智联上爬取的工作，好多事工作内容里有python，只用python谢谢脚本啥的，实际标题上找的是java啊，php啊，这样的工作要删掉 4、剔除数据异常值，过大过小，NA值 5、工作根据，工作，公司情况，工作内容，技能要求等进行评分，目的是找到适合我的工作

pandas实战项目完整版

qq_37812707的博客

09-26

892

pandas

Python Pandas实现考勤数据提取与日历表生成

综上所述，该项目融合了Pandas数据操作、Excel文件处理、模板驱动编程、批量任务调度、时间序列分析及自动化报表生成等多项核心技术，充分展现了Python在办公自动化领域的强大能力。其所涉及的知识点广泛覆盖了数据...