目录
一、学习知识点概要
首先,点击下载数据文件
这是9881场英雄联盟韩服钻石段位以上的排位比赛数据,数据提供了在十分钟时的游戏状态,包括击杀数、死亡数、金币数量、经验值、等级……等信息。列blueWins是数据的标签,代表了本场比赛是否为蓝队获胜。
二、学习内容
代码
1.导入库
## 基础函数库
import numpy as np
import pandas as pd
## 绘图函数库
import matplotlib.pyplot as plt
import seaborn as sns
2.数据载入与处理
df = pd.read_csv('high_diamond_ranked_10min.csv')
y = df.blueWins
"""
利用.info()查看数据的整体信息
#df.info()
标注标签并利用value_counts函数查看训练集标签的数量
#y.value_counts()
"""
## 我们可以去除一些重复变量,比如只要知道蓝队是否拿到一血,我们就知道红队有没有拿到,可以去除红队的相关冗余数据。
drop_cols = ['gameId','blueWins','gameId','blueWins','redFirstBlood',
'redKills','redDeaths','redGoldDiff','redExperienceDiff',
'blueCSPerMin','blueGoldPerMin','redCSPerMin'