六、文件和数据格式化_文件读写文件与数据格式化-优快云博客

本文链接：https://blog.youkuaiyun.com/weixin_61966260/article/details/131792486

本文介绍了Python中文件的打开、读写和关闭，以及一维和二维数据的组织形式，如列表、元组、字符串、数组、矩阵和数据框。同时，讨论了如何使用csv模块读写CSV文件，以及NumPy和Pandas库在处理多维数据中的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 文件的使用:文件打开、读写和关闭。

Python文件的使用主要涉及三个步骤：文件打开、读写和关闭。在打开文件后，可以使用read()方法读取文件内容，使用write()方法写入文件内容。最后，应该使用close()方法关闭文件，或使用with语句自动关闭文件。

文件打开：要打开一个文件，可以使用内置的open()函数。open()函数接受两个参数：文件路径和打开模式。文件路径可以是绝对路径或相对路径。打开模式可以是以下几种：

'r'：只读模式。打开文件后只能读取文件内容，不能修改文件。
'w'：写入模式。打开文件后会清空文件内容，然后可以写入新的内容。
'a'：追加模式。打开文件后可以在文件末尾追加内容。
'x'：创建模式。打开文件，如果文件已存在则报错，如果文件不存在则创建新文件。示例代码如下：

file = open('filename.txt', 'r')

在文件打开后，可以进行文件的读取和写入操作。

读取文件内容：可以使用read()方法来读取整个文件的内容，或使用readline()方法来逐行读取文件内容。

代码如下：

content = file.read()  # 读取整个文件内容
line = file.readline()  # 逐行读取文件内容

写入文件内容：可以使用write()方法来写入文件内容。

代码如下：

file.write('Hello, world!')  # 写入内容到文件

文件关闭：在文件读写完成后，应该使用close()方法来关闭文件，释放资源。

代码如下：

file.close()

为了避免忘记关闭文件，可以使用with语句来自动关闭文件。示例代码如下：

with open('filename.txt', 'r') as file:
    content = file.read()
    # 对文件内容进行操作
# 文件会在with语句结束后自动关闭

2. 数据组织的维度:一维数据和二维数据。

Python中的数据可以按照维度的不同进行组织，主要有一维数据和二维数据。

一维数据：一维数据是最简单的数据组织形式，数据按照线性排列，只有一个维度。常见的一维数据类型包括：

列表（List）：用方括号[]表示，可以存储不同类型的元素，可以通过索引访问和修改元素。

        例如，[1, 2, 3, 4, 5]。

元组（Tuple）：用圆括号()表示，也可以存储不同类型的元素，一旦创建后就不能修改。

        例如，(1, 2, 3, 4, 5)。

字符串（String）：用引号括起来的字符序列，也可以看作是由字符组成的一维数据。

        例如，"Hello, World!"。

数组（Array）：用于存储相同类型的元素，可以使用numpy库来创建和操作数组。

        例如，np.array([1, 2, 3, 4, 5])。

list_data = [1, 2, 3, 4, 5]  # 列表
tuple_data = (1, 2, 3, 4, 5)  # 元组
string_data = "Hello, World!"  # 字符串
array_data = np.array([1, 2, 3, 4, 5])  # 数组

二维数据：二维数据是由行和列组成的数据结构，可以看作是一维数据的扩展。常见的二维数据类型包括：

列表的列表：可以使用列表的列表来表示二维数据，每个内部列表代表一行数据。

        例如，[[1, 2, 3], [4, 5, 6], [7, 8, 9]]。

嵌套列表（Nested List）：类似于列表的列表，但可以有不同长度的行。

        例如，[[1, 2, 3], [4, 5], [6, 7, 8, 9]]。

矩阵（Matrix）：用于存储数值的二维数据，可以使用numpy库来创建和操作矩阵。

        例如，np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])。

数据框（Data Frame）：用于存储结构化数据的二维数据，可以使用pandas库来创建和操作数据框。

        例如，pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})。

list_of_lists = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]  # 列表的列表
nested_list = [[1, 2, 3], [4, 5], [6, 7, 8, 9]]  # 嵌套列表
matrix_data = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])  # 矩阵
data_frame = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})  # 数据框

3. —维数据的处理:表示、存储和处理。

表示多维数据： 多维数据可以使用以下数据结构来表示：

列表的列表：可以使用列表的列表来表示多维数据，每个内部列表代表一维数据的一个维度。

        例如，[[1, 2, 3], [4, 5, 6], [7, 8, 9]]。

NumPy数组：NumPy是一个强大的数值计算库，其中的数组对象可以用来表示多维数据。可以使用np.array()函数来创建多维数组。

        例如，np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])。

Pandas数据框：Pandas是一个用于数据分析的库，其中的数据框对象可以用来表示和处理多维数据。可以使用pd.DataFrame()函数来创建数据框。

        例如，pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})。

存储多维数据： 可以使用不同的文件格式来存储多维数据，常见的格式包括：

CSV（逗号分隔值）：以纯文本形式存储数据，每行表示一条记录，每个字段之间用逗号分隔。使用Pandas的to_csv()方法来将多维数据存储为CSV文件。
Excel：使用Pandas的to_excel()方法将多维数据存储为Excel文件。
HDF5（层次数据格式）：一种用于存储和管理大量科学数据的文件格式，使用PyTables或h5py库来读写HDF5文件。

处理多维数据： 对于多维数据的处理，可以使用以下方法和函数：

索引和切片：使用方括号和索引号对多维数据进行访问和取值。

例如，data[0]表示访问第一个元素，data[:, 1]表示访问第二列的所有元素。

运算和函数：可以对多维数据进行各种数值运算和函数操作，例如加法、减法、平均值等。

可以使用NumPy库中的函数和方法，例如np.sum()、np.mean()等。

数据清洗和转换：可以使用Pandas库提供的函数和方法对多维数据进行清洗和转换，例如删除缺失值、数据类型转换等。

4. 二维数据的处理:表示、存储和处理。

表示二维数据： 二维数据可以使用以下数据结构来表示：

列表的列表：可以使用列表的列表来表示二维数据，每个内部列表代表二维数据的一行。

        例如，[[1, 2, 3], [4, 5, 6], [7, 8, 9]]。

NumPy数组：NumPy是一个强大的数值计算库，其中的数组对象可以用来表示二维数据。可以使用np.array()函数来创建二维数组。

        例如，np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])。

Pandas数据框：Pandas是一个用于数据分析的库，其中的数据框对象可以用来表示和处理二维数据。可以使用pd.DataFrame()函数来创建数据框。

        例如，pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})。

存储二维数据： 可以使用不同的文件格式来存储二维数据，常见的格式包括：

CSV（逗号分隔值）：以纯文本形式存储数据，每行表示一条记录，每个字段之间用逗号分隔。可以使用Pandas的to_csv()方法将二维数据存储为CSV文件。
Excel：可以使用Pandas的to_excel()方法将二维数据存储为Excel文件。
HDF5（层次数据格式）：一种用于存储和管理大量科学数据的文件格式，可以使用PyTables或h5py库来读写HDF5文件。

处理二维数据： 对于二维数据的处理，可以使用以下方法和函数：

索引和切片：使用方括号和索引号对二维数据进行访问和取值。

例如，data[0]表示访问第一行数据，data[:, 1]表示访问第二列的所有元素。

运算和函数：可以对二维数据进行各种数值运算和函数操作，例如加法、减法、平均值等。

可以使用NumPy库中的函数和方法，例如np.sum()、np.mean()等。

数据清洗和转换：可以使用Pandas库提供的函数和方法对二维数据进行清洗和转换，例如删除缺失值、数据类型转换等。通过使用合适的数据结构和方法，可以方便地表示、存储和处理二维数据，以满足不同的需求和应用场景。

5. 采用CSV格式对一二维数据文件的读写。

通过使用csv模块来读写CSV格式的一维或二维数据文件。

读取CSV文件：

import csv
# 打开CSV文件
with open('data.csv', 'r') as file:
    # 创建CSV读取器
    csv_reader = csv.reader(file)
    
    # 逐行读取数据
    for row in csv_reader:
        # 对每一行进行处理
        print(row)

上述代码使用csv.reader()函数创建了一个CSV读取器对象csv_reader，然后使用for循环逐行读取CSV文件中的数据。每一行数据都被表示为一个列表，列表的每个元素对应CSV文件中的一个字段。

写入CSV文件：

import csv
# 要写入的数据
data = [['Name', 'Age', 'City'],
        ['John', '25', 'New York'],
        ['Alice', '30', 'Los Angeles'],
        ['Bob', '35', 'Chicago']]
# 打开CSV文件
with open('data.csv', 'w', newline='') as file:
    # 创建CSV写入器
    csv_writer = csv.writer(file)
    
    # 写入数据
    for row in data:
        csv_writer.writerow(row)

使用csv.writer()函数创建了一个CSV写入器对象csv_writer，然后使用for循环将数据逐行写入CSV文件。每一行数据都应该以列表的形式传递给writerow()方法。