Practical Python项目深入解析：函数的高级用法与CSV文件解析实践-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_01029/article/details/148416155

Practical Python项目深入解析：函数的高级用法与CSV文件解析实践

practical-python Practical Python Programming (course by @dabeaz) 项目地址: https://gitcode.com/gh_mirrors/pr/practical-python

函数调用与参数传递的深入理解

在Python编程中，函数是最基础也是最重要的构建块之一。让我们深入探讨函数的一些高级用法和细节。

函数调用方式

Python提供了两种调用函数的方式：

位置参数调用：按照参数定义的顺序传递值
```
result = function(value1, value2)
```
关键字参数调用：明确指定参数名和值
```
result = function(param1=value1, param2=value2)
```

关键字参数调用方式在参数较多或需要明确参数含义时特别有用，能显著提高代码可读性。

默认参数的使用

默认参数让函数更加灵活：

def read_data(filename, debug=False):
    # 函数体

当调用read_data('data.csv')时，debug参数会自动使用默认值False。这种设计使得函数接口更加简洁，同时保留了灵活性。

返回值机制

Python函数可以返回多种形式的值：

单一值：return x
多个值：实际上返回的是元组
无返回值：默认返回None

def process_data(data):
    if not data:
        return  # 返回None
    result = data * 2
    return result, len(result)  # 返回元组

变量作用域详解

理解变量作用域是掌握Python函数的关键：

局部变量：函数内定义的变量，只在函数内可见
全局变量：模块级别定义的变量，整个文件可见

count = 0  # 全局变量

def increment():
    global count  # 声明使用全局变量
    count += 1
    
def calculate():
    total = 0  # 局部变量
    # 计算逻辑

最佳实践：尽量减少全局变量的使用，优先通过参数传递和返回值来交换数据。

参数传递的实质

Python中的参数传递实际上是"按对象引用传递"，这意味着：

函数内对可变对象（如列表、字典）的修改会影响原始对象
重新赋值参数变量不会影响外部变量

def modify_list(items):
    items.append(42)  # 修改原始列表
    
def reassign_list(items):
    items = [1,2,3]  # 仅影响局部变量

CSV文件解析实战

让我们将这些函数概念应用到实际的文件解析任务中，构建一个强大的CSV解析器。

基础解析功能

import csv

def parse_csv(filename):
    """解析CSV文件为字典列表"""
    with open(filename) as f:
        rows = csv.reader(f)
        headers = next(rows)  # 读取标题行
        return [dict(zip(headers, row)) for row in rows if row]

这个基础版本已经能处理简单的CSV文件，但我们需要增强它的功能。

增强功能实现

列选择功能：只解析指定的列

def parse_csv(filename, select=None):
    with open(filename) as f:
        rows = csv.reader(f)
        headers = next(rows)
        
        if select:
            indices = [headers.index(col) for col in select]
            headers = select
        else:
            indices = []
            
        records = []
        for row in rows:
            if not row:
                continue
            if indices:
                row = [row[i] for i in indices]
            records.append(dict(zip(headers, row)))
            
        return records

类型转换：自动转换字段类型

def parse_csv(filename, select=None, types=None):
    # ...前面的代码...
    
    for row in rows:
        if not row:
            continue
        if indices:
            row = [row[i] for i in indices]
        if types:
            row = [func(val) for func, val in zip(types, row)]
        records.append(dict(zip(headers, row)))
    
    return records

无标题文件处理：返回元组列表而非字典

def parse_csv(filename, select=None, types=None, has_headers=True):
    with open(filename) as f:
        rows = csv.reader(f)
        
        if has_headers:
            headers = next(rows)
            if select:
                indices = [headers.index(col) for col in select]
                headers = select
            else:
                indices = []
        else:
            headers = []
            
        records = []
        for row in rows:
            if not row:
                continue
            if indices:
                row = [row[i] for i in indices]
            if types:
                row = [func(val) for func, val in zip(types, row)]
            if headers:
                records.append(dict(zip(headers, row)))
            else:
                records.append(tuple(row))
                
        return records

自定义分隔符：处理非逗号分隔的文件

def parse_csv(filename, select=None, types=None, 
             has_headers=True, delimiter=','):
    with open(filename) as f:
        rows = csv.reader(f, delimiter=delimiter)
        # 其余处理逻辑不变