快速体验
- 打开 InsCode(快马)平台 https://www.inscode.net
- 输入框内输入如下内容:
编写一个面向初学者的pd.dataframe教学示例。包含:1)从字典创建简单DataFrame 2)行列选择操作 3)添加/删除列 4)简单数据筛选 5)基本统计计算。每个操作都要有详细解释和示例输出,代码注释要通俗易懂,避免使用复杂概念。 - 点击'项目生成'按钮,等待项目生成完整后预览效果

最近在学习Python数据分析,发现pandas的DataFrame真的是个神器。作为新手,刚开始接触可能会觉得有点复杂,但掌握几个基础操作后就能处理大部分日常数据任务了。今天就来分享一下我从零开始学DataFrame的经验,希望能帮助到同样入门的朋友们。
1. 创建第一个DataFrame
DataFrame可以理解成Excel表格的Python版,创建方法很多,最简单的就是用字典。比如我想记录几个朋友的姓名、年龄和城市信息:
- 先导入pandas(别忘装这个库)
- 用字典定义数据,键是列名,值是列表形式的数据
- 用pd.DataFrame()转换成表格
创建后会显示整齐排列的数据,还有自动生成的索引(最左边那列数字)。这个基本结构之后所有操作都会用到。
2. 数据选取的两种姿势
拿到数据第一步就是查看特定内容,DataFrame有超直观的选取方式:
- 选列:直接
df['列名'],比如想看所有人的年龄 - 选行:用
loc[]按索引标签,或者iloc[]按位置数字
有个小技巧:同时选行列可以df.loc[行条件, 列名],类似Excel里选中某个区域。刚开始容易把中括号和圆括号搞混,多练几次就顺手了。
3. 增删改列像玩积木
实际分析时经常要调整列,DataFrame的操作比Excel还简单:
- 新增列:直接
df['新列名']=值就能添加,值可以是计算式 - 删除列:用
drop()方法,记得加axis=1表示列方向
特别注意删除操作默认不修改原数据,要加inplace=True才会真正生效。这个设计是为了防止误操作,很贴心。
4. 筛选想要的数据子集
数据过滤是高频操作,DataFrame能用布尔条件快速筛选:
- 先写条件表达式,比如找年龄大于20的
- 把条件放进方括号
df[条件] - 支持组合条件,用
&(且)、|(或)连接
输出结果还是DataFrame,可以继续其他操作。刚开始可能不习惯这种写法,理解成"把满足条件的行选出来"就简单了。
5. 快速统计不求人
pandas内置的统计方法能省去大量手工计算:
describe()一键生成主要统计量(均值、标准差等)mean()/max()/min()等针对特定列计算value_counts()统计类别分布
这些在数据探索阶段特别有用,不用自己写循环就能快速把握数据特征。
个人实践建议
学完基础操作后,建议找些真实小数据集练手。比如:
- 用电影评分数据练习筛选和统计
- 用天气数据练习增删列
- 自己创建模拟数据尝试各种组合操作
遇到报错别慌,大部分是因为数据类型不匹配或者拼写错误。多看看输出结果的格式,慢慢就能培养出数据操作的直觉。
刚开始用InsCode(快马)平台练习特别方便,不用配环境直接在线写代码,还能实时看到结果输出。它的交互式界面对新手很友好,写错能马上调整,不像本地环境总要重启kernel。

DataFrame还有很多进阶功能,但掌握这些基础已经能处理很多实际任务了。关键是多实践,把每个操作都亲手试几次,很快就能从入门到熟练。
快速体验
- 打开 InsCode(快马)平台 https://www.inscode.net
- 输入框内输入如下内容:
编写一个面向初学者的pd.dataframe教学示例。包含:1)从字典创建简单DataFrame 2)行列选择操作 3)添加/删除列 4)简单数据筛选 5)基本统计计算。每个操作都要有详细解释和示例输出,代码注释要通俗易懂,避免使用复杂概念。 - 点击'项目生成'按钮,等待项目生成完整后预览效果
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

被折叠的 条评论
为什么被折叠?



