pandas操作csv以及可视化操作(实例)

本文详细介绍了如何利用Python的pandas库进行CSV数据的读取、操作和分析,包括数据清洗、筛选、合并等基本操作,并进一步探讨了如何结合matplotlib进行数据可视化,如绘制柱状图、折线图等。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

# -*- coding: utf-8 -*-
""" 
@Time    : 2022/5/5 10:11
@Author  : Mr Wang
@FileName: main_usepd.py
@SoftWare: PyCharm
"""
import pandas as pd
import numpy as np

pd.set_option('display.max_rows', 2000)

import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['KaiTi']

#数据清洗,不符合的改为NAN
def data_clean(sex):
    if (sex == 'f') | (sex == 'female'):
        return 'female'
    elif (sex == 'm') | (sex == 'male'):
        return 'male'
    else:
        return np.NAN


if __name__ == '__main__':
    path = 'E:\python\data_mining\codes1\lect01_proj\survey.csv'
    #usecols表示只需的列
    df = pd.read_csv(path, usecols=['Country', 'Gender'])
    #重写列名
    df.rename(columns={'Country': 'cou', 'Gender': 'gen'}, inplace=True)

    # print(df.head())

    df['gen'] = df['gen'].replace(' ', '')
    #一定要加str才可以使用lower()
    df['gen'] = df['gen'].str.lower()
    #qpply函数运用于该列的每一个数据
    df['gen'] = df['gen'].apply(data_clean)
    #默认有一个为空就删除
    df = df.dropna()

    #多
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值