项目背景
《 Candy Crush Saga》是由King(动视暴雪的一部分)开发的一款热门手机游戏,全球有数百万人玩此游戏。游戏由一系列关卡构成,玩家需要将相似的糖果配对在一起(希望)清除关卡并在关卡地图上继续前进。Candy Crush有3000多个级别,并且每周都会添加新的级别。那是很多层次!在这么多的关卡中,正确设置关卡难度很重要。太容易了,游戏变得无聊,太难了,玩家变得沮丧而退出游戏。
本文旨在判断游戏难度以调整,为维护玩家稳定性。
数据简介
指标 | 含义 |
---|---|
player_id | 玩家ID |
dt | 时间 |
level | 游戏关卡等级 |
num_attempts | 尝试次数 |
num_success | 成败。0失败1~6均为成功。 |
操作步骤
- 导入数据
- 数据概览
- 新建数据库
- 导入数据表
使用逗号将数据分列将日期排序更改为与源数据相同的年月日的格式,日期分割符改为短横线
预览导入效果
导入后数据显示
还有双引号的列名没有处理,后续清洗时再接着整理。
- 清洗数据
修改字段名,及类型
目前已经将字段名进行了修改,字段类型需要在调整完数据格式后再修改,否则系统无法识别数据,会导致修改不成功。
- 删除数据中的双引号
先用select语句尝试语法,然后使用update将源数据改变
可行。接下来把dt、num_success列也使用相同方法进行清洗。
UPDATE candy_crush set dt = SUBSTRING(dt,3,10);
UPDATE candy_crush set num_success = SUBSTRING