pandas 读取csv 按行读取

最新推荐文章于 2025-07-17 11:37:07 发布

零一睡不醒

最新推荐文章于 2025-07-17 11:37:07 发布

阅读量3.1w

点赞数 8

CC 4.0 BY-SA版权

分类专栏： python基础

本文链接：https://blog.youkuaiyun.com/qq_34333481/article/details/96426503

python基础专栏收录该内容

39 篇文章

订阅专栏

本文介绍了使用Python的pandas库来读取CSV文件的方法，并展示了如何将读取的数据存储到多个字典中以方便进一步的数据处理。针对特定的分隔符导致的警告问题提供了有效的解决方案。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

import pandas as pd
csvfile = open('text.csv',encoding='utf-8')
df = pd.read_csv(csvfile,engine='python')
# 按行读取保存到字典里，假设每行有三个字段，item_id,info,title
dict_item_id = {}
dict_info = {}
dict_title = {}
dict_item_id_reverse = {}
for i in range(len(df)):
    dict_item_id[i] = df["item_id"][i]
    dict_info[i] = df["info"][i]
    dict_title[i] = df["title"][i]
    dict_item_id_reverse[df["item_id"][i]] = i

通过字典的key i 构建了item_id,info,title字段的关联,方便后续数据的处理。

目的是分别提取出每行每个字段下面的数据。

1、pandas.read_csv()函数，读取文件数据时，由于分隔符为'::'，弹出如下警告

警告：ParserWarning: Falling back to the 'python' engine because the 'c' engine does not support regex separators (separators > 1 char and different from '\s+' are interpreted as regex)

解决方法：增加函数的引擎参数engine='python'，如下：

header = ['user_id', 'item_id', 'rating', 'timestamp']
df = pd.read_csv("D:/ratings.dat", sep='::', names=header,engine='python')