Python基础语法体系:文件与数据格式化
目录
前六周内容回顾
基础语法体系
-
数据类型与操作
- 数字类型:整数/浮点数/复数
- 字符串操作:索引/切片/格式化
- 组合数据类型:集合/序列(元组/列表)/字典
-
程序控制结构
- 分支结构:单分支/二分支/多分支/异常处理
- 循环结构:for遍历循环/while无限循环
- 流程控制:break/continue/else扩展用法
-
函数与复用
- 函数定义:一般函数/lambda匿名函数
- 参数传递:可选参数/可变参数/名称传递
- 函数递归:基例/递归链条实现
本周学习目标
能力培养
- 掌握文件读写操作
- 理解数据格式化思想
- 实现数据规范化表示与操作
- 开发具备文件I/O功能的程序
方法论建立
- 从Python视角理解数据表示
- 掌握数据存储与处理的规范思维
核心知识点
1. 文件操作
- 文件打开模式:r/w/a/x/b
- 文本文件与二进制文件操作
- with语句上下文管理
- 文件指针操作
2. 数据格式化
数据类型 | 特点 | 典型应用 |
---|---|---|
一维数据 | 线性结构 | CSV文件/列表存储 |
二维数据 | 表格结构 | Excel/嵌套列表 |
高维数据 | 多层嵌套结构 | JSON/数据库存储 |
3. 词云可视化
- wordcloud库核心方法
- 中文分词处理
- 词频统计优化
- 样式参数配置
实践案例
案例1:自动轨迹绘制
import turtle
with open('data.txt') as f:
for line in f:
angle, distance = map(int, line.split(','))
turtle.left(angle)
turtle.forward(distance)
turtle.done()
案例2:政府工作报告分析
import jieba
from wordcloud import WordCloud
# 读取文件
with open('government_report.txt') as f:
text = f.read()
# 中文分词
words = jieba.lcut(text)
# 生成词云
wc = WordCloud(font_path='msyh.ttc',
width=800,
height=600)
wc.generate(' '.join(words))
wc.to_file('report_cloud.png')
学习建议
- 文件操作:重点掌握
with open() as
模式 - 数据格式:理解CSV/JSON格式转换
- 实践优先:通过政府报告案例串联知识点
- 可视化扩展:探索pyecharts等可视化库
下阶段预告:面向对象编程与Python高级特性