如何打造优秀的大数据团队|

本文探讨了企业建设大数据平台所需的核心团队构成及其工作职责,包括基础平台团队、数据平台团队及数据分析团队,并介绍了不同组织架构的优势与劣势。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

对于企业来说,要建设自己的大数据平台,需要的不只是技术解决方案,更重要的是组建一支优秀的数据团队。那么,数据团队有哪些成员组成?他们的工作方式是什么?采用怎样的组织架构来开展工作?

14829792303364.jpg

  1. 数据团队成员

  这里只讨论数据团队中核心成员的角色和他们的工作职责。

  1)基础平台团队

  主要负责搭建稳定、可靠的大数据存储和计算平台。

  核心成员包括:

  数据开发工程师

  负责Hadoop、Spark、Hbase和Storm等系统的搭建、调优、维护和升级等工作,保证平台的稳定。

  数据平台架构师

  负责大数据底层平台整体架构设计、技术路线规划等工作,确保系统能支持业务不断发展过程中对数据存储和计算的高要求。

  运维工程师

  负责大数据平台的日常运维工作

  2)数据平台团队

  主要负责数据的清洗、加工、分类和管理等工作,构建企业的数据中心,为上层数据应用提供可靠的数据。

  数据开发工程师

  负责数据清洗、加工、分类等开发工作,并能响应数据分析师对数据提取的需求。

  数据挖掘工程师

  负责从数据中挖掘出有价值的数据,把这些数据录入到数据中心,为各类应用提供高质量、有深度的数据。

  数据仓库架构师

  负责数据仓库整体架构设计和数据业务规划工作。

  3)数据分析团队

  主要负责为改善产品体验设计和商业决策提供数据支持。

  业务分析师

  主要负责深入业务线,制定业务指标,反馈业务问题,为业务发展提供决策支持。

  建模分析师

  主要负责数据建模,基于业务规律和数据探索构建数据模型,提升数据利用效率和价值。

  2. 数据团队的工作方式

  数据团队的工作可以分成两大部分,一部分是建设数据存储和计算平台,另一部分是基于数据平台提供数据产品和数据服务。

  平台的建设者包括三种人群:基础平台团队对hadoop、spark、storm等各类大数据技术都非常熟悉,负责搭建稳定、可靠的大数据存储和计算平台。数据平台团队主要负责各类业务数据进行清洗、加工、分类以及挖掘分析,然后把数据有组织地存储到数据平台当中,形成公司的数据中心,需要团队具有强大的数据建模和数据管理能力。数据产品经理团队主要是分析挖掘用户需求,构建数据产品为开发者、分析师和业务人员提供数据可视化展示。

  平台的使用者也可以包括三种人群:数据分析团队通过分析挖掘数据,为改善产品体验设计和商业决策提供数据支持。运营、市场和管理层可以通过数据分析师获得有建设性的分析报告或结论,也可以直接访问数据产品获得他们感兴趣的数据,方便利用数据做决策。数据应用团队利用数据平台团队提供的数据开展推荐、个性化广告等工作。

  3. 数据分析团队的组织架构

  在整个大数据平台体系中的团队:基础平台、数据平台、数据应用和数据产品经理团队都可以保持独立的运作,只有数据分析团队的组织架构争议比较大。数据分析团队一方面要对业务比较敏感,另一方面又需要与数据平台技术团队有深度融合,以便能获得他们感兴趣的数据以及在数据平台上尝试实验复杂建模的可能。

  从他们的工作方式可以看出,数据分析团队是衔接技术和业务的中间团队,这样的团队组织架构比较灵活多变:

  1)外包

  公司自身不设立数据分析部门,将数据分析业务外包给第三方公司,当前电信行业,金融行业中很多数据分析类业务都是交给外包公司完成的。

  优势: 很多情况下,可以降低公司的资金成本和时间成本;许多公司内部缺乏相关的知识与管理经验,外包给专业的团队有助于公司数据价值的体现 。

  劣势:一方面外包人员的流动和合作变数,对数据的保密性没有保证;另外一方面,外包团队对需求的响应会比较慢,处理的问题相对通用传统,对公司业务认知不如内部员工深入,创新较低。

  2)分散式

  每个产品部门独立成立数据分析团队,负责响应自己产品的数据需求,为业务发展提供决策支持。

  优势:数据分析团队与开发团队、设计团队以及策划团队具有共同的目标,团队整体归属感强,绩效考核与产品发展直接挂钩,有利于业务的发展。

  劣势:在业务规模比较小的情况下,数据分析师比较少,交流的空间也比较小。因为身边的同事都不是该领域的人才,无法进行学习交流,所以成长空间会比较小,分析师的流失也会比较严重,最终陷入招募新人——成长受限——离职——招募新人的恶性循环。另一方面,每个产品团队都零星地招募几个分析师,整体来看给员工的感觉是公司并不是特别重视数据化运营的文化,对数据的认同感会被削弱,不利于公司建立数据分析平台体系。

  3)集中式

  数据分析团队与产品团队、运营团队各自独立,团队的负责人具有直接向分管数据的副总裁或CEO直接汇报的权限,团队负责响应各业务部门的数据需求。

  优势:分析团队具有充分的自主权,可以专心建设好公司级别的数据平台体系,研究数据最具有价值的那些问题,有权平衡业务短期需求和平台长期需求直接的关系。另一方面,这种自上而下建立起来组织架构,可以向全体员工传达数据在公司的重要位置,有利于建立数据化运营的文化。

  劣势:产品业务团队会觉得他们对数据的掌控权比较弱,一些业务数据需求得不到快速响应,认为分析团队的反应太慢无法满足业务发展的需要。随着业务发展越来越大,产品团队会自己招募分析师来响应数据需求,逐渐替代分析团队的工作,这样势必会导致分析团队的工作被边缘化。

  4)嵌入式

  数据分析团队同样独立于产品团队存在,但只保留部分资深数据专家,负责招聘、培训数据分析师,然后把这些人派遣到各产品团队内部,来响应各类业务数据需求。

  优势:团队的灵活性比较好,可以根据公司各业务线的发展情况合理调配人力资源,重点发展的项目投入优秀的人才,一些需要关闭的项目人才可以转移到其他项目中去。

  劣势:分析师被嵌入到产品团队内部,受产品团队主管的领导,从而失去了自主权,导致沦落为二等公民。人事关系在公司数据分析团队中,却要被业务团队主管考核,但业务团队主管并不关心他们的职业发展,导致分析师的职业发展受到限制。

  那么,到底采取哪一种组织架构比较合适呢?

  可以根据公司数据化运营进展的深度灵活采取一种或几种方式。除了外包模式,其他组织架构我都经历过,简单来说,早期采用分散式、中期采用集中式、后期采用分散式或嵌入式以及两则并存。

  早期:公司对数据体系的投入一般是比较谨慎的,因为要全面建设数据体系需要投入大量的人力和财力,公司不太可能还没有看清楚局势的情况下投入那么多资源。所以,往往都是让每个产品团队自己配置分析师,能解决日常的业务问题就行。杭研院早期的网易云阅读、印像派等项目中就是采用的这种分散的模式。

  中期:随着业务的发展、公司对数据的认识有所提高并且重视程度不断加大,就开始愿意投入资源来构建公司级别的数据体系。这个阶段采用集中式有利于快速构建数据分析平台,为公司各个产品团队提供最基础的数据分析体系,能在未来应对业务的快速发展。杭研院花了两年时间完成了这个阶段的主要工作,并在网易云音乐和易信产品发展阶段起到了至关重要的作用。

  后期:一旦公司级别的数据分析平台构建完成,消除了早期分散模式中分析师缺少底层平台支持的窘境,他们能够在分析平台上自助完成大量的数据分析工作。而且经历过集中式阶段的洗礼,公司上上下下对数据的认识都有了很大的提高。此时,在回到分散模式时,原先的很多弊端已基本消除,此外,采用嵌入模式也是可以的。目前杭研院在网易云音乐、网易云课堂、考拉海购等几个产品中就是分散式和嵌入式并存的架构。

  总之,没有最好的组织架构,只有适合自己的组织架构。(来源:联商网)

  【作者介绍 沈琦:网易杭州研究院商业智能部门总监、大数据技术专家 自2007年毕业以来,一直在网易杭研院从事大数据技术的相关工作,现担任商业智能部门总监,负责管理杭研院和考拉两个商业智能团队,在大数据技术和部门管理方面都具有丰富的经验。商业智能部门负责网易数个亿级用户产品的数据分析工作,覆盖考拉海淘、云音乐、云课堂、云阅读和易信等众多网易明星级产品。】



本文出处:畅享网
本文来自云栖社区合作伙伴畅享网,了解相关信息可以关注vsharing.com网站。

大数据项目组人员配置 演讲人 2021-08-08 大数据项目组人员配置全文共27页,当前为第1页。 目录 01. 背景 07. 产品设计类 03. 出发点 05. 基础平台类 02. 目标分析 04. 人员配置结构 06. 技术研发类 08. 实施项目经理 大数据项目组人员配置全文共27页,当前为第2页。 01 背景 大数据项目组人员配置全文共27页,当前为第3页。 目前公司大数据项目的优先级提升,数据项目对公司来讲具备极强战略意义 原有数据中心项目组成员经常变动,无法专注在一个项目上,因此输出速度和质量无法有效保障 原有数据项目的优先级和利害程度没有现在这么高,因此原有项目组人员配置不完整 背景 大数据项目组人员配置全文共27页,当前为第4页。 02 目标分析 大数据项目组人员配置全文共27页,当前为第5页。 目标分析 为了使数据中心能够更快更高质量落地,需要完善团队人员 为了提升数据中心的产品质量,需要完善团队人员 大数据项目组人员配置全文共27页,当前为第6页。 03 出发点 大数据项目组人员配置全文共27页,当前为第7页。 出发点 数据中心项目落地,并不仅仅与开发完成的软件系统相关,涉及到各方各面。其中包括前期咨询,中期系统建设,售后落地实施和售后保障。 举个例子,数据中心的落地,就好比开一家火锅店。数据中心这个系统仅仅相当于火锅店的底料配方。数据中心落地,就好比经营一家火锅店,还需要考虑菜品供应商,n多经营许可证,财务管理,店铺租用,成本核算,人员管理,制度建设等等方面。而这 方面恰恰是重要但是单从技术和产品角度无法预知和控制的方面,这方面没有经历过会有较大风险。 为了规避风险,提升落地可行性,提出以下人员配置的建议 大数据项目组人员配置全文共27页,当前为第8页。 04 人员配置结构 大数据项目组人员配置全文共27页,当前为第9页。 在大数据团队组建过程中,科学地定义职位体系直接影响到大数据实施的效率和质量,由于大数据的创新性和严谨性,会有一批新的岗位,例如首席数据官、大数据解决方案架构师、大数据采集工程师、大数据研究员等;同时,也会强化原有岗位的新生命力,例如网络工程师、算法工程师、系统架构师、咨询顾问、数据库管理与开发等。整个职位架构体系如下图所示 人员配置结构 大数据项目组人员配置全文共27页,当前为第10页。 数据中心项目岗位体系 基础平台类 基础平台类:大数据基础平台共分为硬件平台和软件平台两大类别,硬件平台包括服务器、操作系统和网络维护等工作,主要由网络工程师负责;软件平台包括Hadoop运维、数据仓库管理、软件系统运维等工作,由 Hadoop运维工程师、数据仓库管理员和系统管理员负责。 技术研发类 技术研发类:技术研发类岗位指的是针对大数据相关系统、软件、产品和功能进行的开发,而非IT系统的开发。由于大数据类的开发是一个相对完整的工作链,并且具有特殊应用需求和场景特征,因此涵盖了几乎与IT系统相同的职能岗位。技术研发类岗位包括大数据架构师、数据仓库架构师、大数据开发工程师、数据采集工程师、数据仓库开发工程师、系统开发工程师、算法开发工程师。 大数据项目组人员配置全文共27页,当前为第11页。 产品设计类 产品设计类:项目产品类岗位通常是每个公司不可或缺的岗位,这些岗位是有计划开发数据工作的基本前提,通常决定了一个产品或项目未来的方向和具体实施的概念定义。而项目产品类泛指数据项目工作的前端职位,含项目经理、产品经理、UI、UE等 数据中心项目岗位体系 大数据项目组人员配置全文共27页,当前为第12页。 05 基础平台类 大数据项目组人员配置全文共27页,当前为第13页。 偏向硬件管理工程师和运维工程师等。目前暂时由研发人员承担,这部分需要多少人需要什么人要研发来出建议 基础平台类 大数据项目组人员配置全文共27页,当前为第14页。 06 技术研发大数据项目组人员配置全文共27页,当前为第15页。 大数据架构师(近6个月内不重要,6个月后看发展方向决定是否需要):作为大数据技术平台成功落地的重要保障,大数据架构师在大数据技术发展之初就已经奠定了必不可少的角色基础,该职位主要负责Hadoop技术解决方案的整个生命周期的解决方案确定并进行引导,包括:大数据需求分析、平台选择、技术架构设计、应用设计和开发、应用测试和部署等大数据实施全流程的跟踪,并在实施过程中带领技术团队,为设计和开发大规模集群的数据处理系统提供技术和管理。 技术研发大数据项目组人员配置全文共27页,当前为第16页。 作为一个或多个领域的系统架构专家,更要面向未来:设计领先的软件架构,洞察所在领域的系统技术发展趋势,提出新的系统架构理念,主导架构技术项目开展架构原型的验证,保证未来新产品的软件架构具有领先的架构竞争力;改进已有产品的软
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值