写在前面
场景:每周销售数据报表整理
- 任务描述: 你需要每周从多个Excel文件中汇总销售数据,计算各项指标(销售额、订单量、客单价等),并生成周报。
- Excel操作痛点:
- 文件太多,手动打开复制粘贴,效率低下,容易出错。 多个Excel文件,每个都要打开、筛选、复制数据,重复劳动,耗时费力。
- 公式复杂,容易出错,维护困难。 为了计算各种指标,Excel公式写得又长又复杂,一旦数据格式变动,公式就容易出错,排查和维护非常麻烦。
- 数据量稍大,Excel卡顿,操作缓慢。 当数据量稍大时,Excel 运行速度明显变慢,操作卡顿,等待时间长,效率更低。
- 流程固定,缺乏灵活性,无法自动化。 每周重复相同操作,流程固定,想要自动化处理,Excel 脚本 (VBA) 学习成本高,且不够灵活。
想象一下,如果使用 Python,情况会是怎样?
- Python 代码高效处理:
- 几行代码搞定文件读取和数据合并。 使用 Python 的 Pandas 库,几行代码就能批量读取多个 Excel 文件,并将数据快速合并成一个 DataFrame (类似 Excel 表格的数据结构)。
- 简洁代码完成指标计算,清晰易懂,不易出错。 Pandas 提供了强大的数据处理和计算功能,可以用简洁、易懂的代码完成各种指标的计算,代码逻辑清晰,不易出错,方便维护。
- Python 处理海量数据,速度快,效率高。 Pandas 底层使用高性能的 C 语言库,处理大量数据速度非常快,远超 Excel 的性能。
- Python 脚本一键运行,实现自动化,解放重复劳动。 编写好的 Python 脚本可以一键运行,自动完成数据整理、计算和报表生成,彻底解放每周重复的手工劳动。
这看似“魔法”般的操作,其基础正是我们今天要学习的 Python 核心语法! 掌握 Python 的基本数据类型、运算符、变量和输入输出,你就能迈出用 Python 高效处理数据的第一步,告别 Excel 的繁琐操作,让数据分析工作事半功倍。
🔢 一、Python 的基本数据类型:数据的不同形态
Python 是一种 动态类型 的编程语言,这意味着你不需要显式声明变量的数据类型,Python 会根据你赋给变量的值自动推断数据类型。 Python 内置了多种常用的数据类型,我们先来学习最常用的几种:
1. 数值类型 (Numeric Types)
数值类型用于表示数字,Python 中主要的数值类型包括:
-
整型 (int): 用于表示整数,例如:
10
,-5
,0
,999999
。 Python 的整型可以表示任意大小的整数,没有大小限制。age = 30 temperature = -5 count = 10000
-
浮点型 (float): 用于表示带有小数点的数字,例如:
3.14
,-2.5
,0.0
,1.23e5
(科学计数法)。price = 99.99 pi = 3.1415926 rate = 0.05
-
复数型 (complex): 用于表示复数,由实部和虚部组成,例如:
3+4j
,-1-2j
。 虚部以j
或J
结尾。 复数类型在科学计算和工程领域中较为常用,数据分析中相对较少使用,初学者可以先了解即可。z = 3 + 4j print(z.real) # 输出实部:3.0 print(z.imag) # 输出虚部:4.0
2. 字符串类型 (Text Type: str)
字符串类型用于表示文本信息,用 单引号 ' '
或 双引号 " "
包裹起来。 例如:'hello'
, "Python"
, '数据分析'
, "123"
。
name = 'Alice'
message = "Welcome to Python!"
address = '北京市朝阳区'
phone_number = "13812345678"
字符串的特点:
-
不可变性 (Immutable): 字符串一旦创建,其内容就不能被修改。 任何对字符串的操作,例如拼接、切片等,都会返回一个新的字符串,而不会修改原始字符串。
-
可以使用单引号或双引号: 单引号和双引号在 Python 中都可以用来表示字符串,通常情况下可以互换使用。 但如果字符串本身包含单引号或双引号,则需要使用另一种引号来包裹,或者使用转义字符
\
。string1 = 'This is a string with "double quotes".' # 字符串中包含双引号,用单引号包裹 string2 = "This is a string with 'single quotes'." # 字符串中包含单引号,用双引号包裹 string3 = 'It\'s a beautiful day.' # 字符串中包含单引号,使用转义字符 \' string4 = "He said, \"Hello!\"" # 字符串中包含双引号,使用转义字符 \"
3. 布尔类型 (Boolean Type: bool)
布尔类型用于表示真或假,只有两个值:True
(真) 和 False
(假)。 布尔类型通常用于逻辑判断和条件控制。
is_adult = True
is_raining = False
result = 10 > 5 # result 的值为 True
布尔类型的特点:
-
逻辑值:
True
和False
是 Python 中的布尔值,注意首字母大写。 -
用于条件判断: 布尔类型常用于条件语句 (例如
if
语句) 和循环语句 (例如while
语句) 中