本文灵感来源于Kaggle比赛-旧金山犯罪预测。小编感觉在犯罪打击上面,数据可视化能够很好的做到犯罪打击,给公安机关提供良好的分析依据和可视化的预警效果。因为犯罪数据基本上不公开,我们本文用到的是Kaggle比赛里面提供的旧金山2015年犯罪的开源数据。
话不多说,直接上干货!
本文使用的是jupyter Notebook。大家可以下载Anaconda,里面自带jupyter Notebook,以后做数据分析常用这个工具。
#下面导入我们常用的python数据分析库
import pandas as pd
import numpy as np
import os
#打开指定路径的文件夹,并读取csv文件train.csv
os.chdir("/Users/Administrator/Desktop/比赛素材/旧金山犯罪分类预测")
data=pd.read_csv("train.csv")
我们直接查看前5行的信息,这个时候你会发现全是英文的,这可以对我们之后分析有一点影响,我们直接强行改成中文。
#强行修改列名改成中文
data.columns=["日期","犯罪类型","犯罪描述","星期","所属街区","处理结果","犯罪地址","经度","纬度"]
#查看一下改完之后的样子
data.head()
#效果如下