小白同学终于毕业啦!学过高等数学、java、C++、数据库等课程,擅长编写算法,参加过多次数学建模大赛,在这个背景下,小白毅然决然选择了数据分析师这个岗位,毕业后顺利进入一家互联网公司,开始职场初体验。
本周小白正式入职,在师兄带领下,开始第一周的工作。
然而信心满满的小白看到工作内容,感受到深深的压力——理想与现实、学校理论与职场实践,差异不是一点……
问数据需求为何物,码千万代码不知年
当小白刚刚坐下来,就碰到了职场第一个难题——需求理解。业务方纷至沓来,提了这样一批需求……
需求
小白虽然有点懵,但是想着循序渐进,应该可以搞定,那就先从第一个需求开始吧。
和师兄以及业务同学了解背景后,小白整理了下第一个需求的求解思路:
先明确统计的值,是用户数——可以根据用户注册表的主键字段计数 user_id(用户id),不去重也可以count1。
然后根据用户属性设置过滤条件,比如sp_status(用户状态)这样的临时、业务变化较多的枚举值。
最后可以将user_star_name(用户等级)设置为group by的汇总项。
以此类推……
搬砖走起
需求的代码语言逐渐清晰,和业务、和师兄都理解并确认实施可行性了,但是第二关又来了——计算逻辑设计。
虽然公司数据仓库已经有沉淀,但是业务发展快,数据生产加工供不应求,数据体系已经有些混乱了,具体操作步步维艰——太难找!难理解!太难用!
比如:大部分数据还是需要从已有事实明细数据中再加工,极少部分是可简单汇总得到……
唉,业务着急,还是慢慢搬砖吧!
(努力搬砖中的小白……)
搬砖成果
不知不觉,已经下午4点,第一个需求完成,最终输出指标30个,代码百行+,还有待验证和优化。