管理学大师德鲁克曾说过:“如果你不能衡量它,那么你就不能有效增长它。”所以为了推进业务的发展,我们必须对我们的用户有清晰的认识。本文通过Python分析拍拍贷互联网金融数据训练营中提供的数据集,构建用户画像。
一.提出问题
根据给定的数据构建包含性别,学历,是否首标,年龄分布的用户画像。
二.数据处理
将数据导入后,依次进行重复值,缺失值以及异常值的检查。
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import os
#为了解决中文标签无法显示的问题
import matplotlib as mpl
mpl.rcParams['font.sans-serif']=['SimHei']#指定默认字体 SimHei为黑体
mpl.rcParams['axes.unicode_minus']=False #用来正常显示负号
#导入数据
os.chdir('C:\\Users\\adm\\Desktop\\')
data_LC=pd.read_csv('LC.csv')
data_LC.info()
data_LC.describe()
data_LC = LC.dropna(how='any')
可以发现数据很干净
!