pandas 读取csv 按行读取

本文介绍了使用Python的pandas库来读取CSV文件的方法,并展示了如何将读取的数据存储到多个字典中以方便进一步的数据处理。针对特定的分隔符导致的警告问题提供了有效的解决方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

import pandas as pd
csvfile = open('text.csv',encoding='utf-8')
df = pd.read_csv(csvfile,engine='python')
# 按行读取保存到字典里,假设每行有三个字段,item_id,info,title
dict_item_id = {}
dict_info = {}
dict_title = {}
dict_item_id_reverse = {}
for i in range(len(df)):
    dict_item_id[i] = df["item_id"][i]
    dict_info[i] = df["info"][i]
    dict_title[i] = df["title"][i]
    dict_item_id_reverse[df["item_id"][i]] = i

通过字典的key i 构建了item_id,info,title字段的关联,方便后续数据的处理。

目的是分别提取出每行每个字段下面的数据。

1、pandas.read_csv()函数,读取文件数据时,由于分隔符为'::',弹出如下警告

       警告:ParserWarning: Falling back to the 'python' engine because the 'c' engine does not support regex separators (separators > 1 char and different from '\s+' are interpreted as regex)

       解决方法:增加函数的引擎参数engine='python',如下:

header = ['user_id', 'item_id', 'rating', 'timestamp']
df = pd.read_csv("D:/ratings.dat", sep='::', names=header,engine='python')


 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值