数据预处理

一般例如json数据可以用Pandas进行数据处理
with open('xxx.json','r', encoding = 'utf-8') as filename

import json
import pandas as pd
# 读取JSON文件, utf-8保留中文
with open('json/prompt.json', 'r', encoding='utf-8') as file:
    data = json.load(file)
# 存储提取的内容
extracted_data = []

# 遍历
for item in data:
	if item['kwargs'] != "{}":  # 或者 if 'kwargs' in item:
		kwargs_dict = item
		extracted_data.append(kwargs_dict)

# 写入新的JSON文件,可以同时写多个,ensure_ascii false保留中文,index 缩进4格
with open('new1.json','w',encoding = 'utf-8') as newfile1, with open ('new2.json','w',encoding = 'utf-8') as newfile2:
	json.dump(extracted_data, newfile1, ensure_ascii = False, index = 4)

# df格式
df = pd.DataFrame(data)
# csv保存
# 如果需要保存为CSV文件
df.to_csv('output.csv', index=False, encoding='utf-8') # 此处index是索引,,不包含索引
		

Pandas DataFrame 提供了丰富的数据处理和查看方法。以下是一些常见的方法和示例代码:

查看数据

  1. 查看前几行数据

    df.head()
    

    查看前5行数据。

  2. 查看后几行数据

    df.tail()
    

    查看后5行数据。

  3. 查看数据的基本信息

    df.info()
    

    显示数据类型、非空值计数等信息。

  4. 查看描述性统计信息

    df.describe()
    

    显示数据的统计信息,如平均值、标准差等。

处理缺失值

  1. 查找缺失值

    df.isnull().sum()
    

    查看每列缺失值的数量。

  2. 删除包含缺失值的行

    df.dropna()
    

    删除包含任何缺失值的行。

  3. 填充缺失值

    df.fillna(value)
    

    用指定值填充缺失值。例如,用0填充:

    df.fillna(0)
    

数据选择与过滤

  1. 选择列

    df['column_name']
    

    选择单列数据。

    df[['column1', 'column2']]
    

    选择多列数据。

  2. 选择行

    使用行索引选择行:

    df.loc[0]
    

    使用条件过滤行:

    df[df['column_name'] > value]
    

数据操作

  1. 添加新列

    df['new_column'] = df['column1'] + df['column2']
    
  2. 删除列

    df.drop(columns=['column_name'])
    
  3. 重命名列

    df.rename(columns={'old_name': 'new_name'}, inplace=True)
    
  4. 数据排序

    df.sort_values(by='column_name', ascending=False)
    

数据合并

  1. 按列合并

    df1.merge(df2, on='common_column')
    
  2. 按行合并

    pd.concat([df1, df2])
    
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值