部门内分为大数据研发,数据分析,数据仓库,算法应用和大数据产品这5个组。数据研发组主要负责使用hadoop spark flink等计算工具,hdfs hbase es等存储工具,kafka等消息队列,完成对离线和实施数据的处理和存储,实现报表需求,算法特征计算需求,数据查询接口等。数据分析主要是为业务提供基于数据的辅助,主要需要会hive,sql等工具,有时也会用到简单的一些模型,工作内容往简单的说有数据调取,复杂了说有一些专题性的分析,对业务的诊断指导等。数据仓库组主要是把从业务库等地方的数据同步,清洗,分层建模等,让分析师和算法人员数据用的爽。算法应用会基于机器学习和深度学习等方法,解决实际的业务问题,如推荐服务,预测单量等。数据产品主要是负责和完善一些大数据工具,如报表系统,现在很火的大数据中台等。
作者:Hahachao
链接:https://www.zhihu.com/question/275484568/answer/1175636443
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
687

被折叠的 条评论
为什么被折叠?



