杏树林孙文亮:在线医疗数据驱动实战

数据驱动医疗应用
杏树林信息技术有限公司通过构建数据驱动的基础设施,包括标准建设和数据系统建设,有效推动了医疗应用的发展。借助神策数据和AnalyticsDB,实现了从产品迭代、运营到技术层面的数据驱动实践。


伴随医疗水平的提升、医疗应用场景信息化建设的加速,医疗行业对大数据的需求有增无减,并主要集中在提升医疗效率和医疗水平,实现数据驱动业务发展等方面。在大数据驱动医疗行业发展的浪潮中,有一些企业走在了前沿。

杏树林信息技术(北京)有限公司(下称“杏树林”)是一家专注于移动互联网医疗应用解决方案的公司,专注为医学专业人士开发移动工具,让行医更轻松。 公司旨在为中国的医务工作者提供基于智能手机和平板电脑的临床信息服务。

近期,杏树林数据分析负责人孙文亮公开分享了数据驱动的基础设施,从产品、运营、技术三个方面介绍如何深入应用大数据,并利用数据驱动业务的实践,具有一定的行业指导意义。


数据驱动的基础设施:标准建设和数据系统建设

工欲善其事,必先利其器。要想让数据更好的为各部门所用,驱动业务增长,就需要坚实的基础建设,包括标准建设和数据系统建设两大部分。杏树林在今年3月份接入神策数据,为了提升沟通效率,让后续的工作事半功倍,需要定义规范和标准建设。

命名规范区分行为和功能,标准要统一。区分行为和功能是规范的重点。功能是每一个产品独特具有的东西,有可能是功能点、功能聚合,也有可能是功能本身;行为是在任何功能里都会存在的,比如说新闻、药典都会有点击和访问事件。

0?wx_fmt=png


命名三选其一。孙文亮介绍,命名有三种方式,分别是按行为命名、按功能命名、按照功能与行为交叉命名。他强调,三者只能选其一,统一规范命名方式将会为后续的工作带来很大便利。

开工前要定义清楚公共行为和公共属性。公共行为一般是指激活,注册,升级,推送等行为。公共属性更常见,例如渠道,页面名称等。渠道有可能叫 channel,也有可能叫source。 这些如果不在开工前定义清楚,后期统计会遇到很多问题。

0?wx_fmt=png

流程规范,整个流程数据人员都应参与。一个规范的操作流程能够加速数据驱动的进展。 举个反面例子,数据组经常会收到一些需求:这是一个运营活动,需要统计一下数据。但此时活动已经做完,其中已经有数据缺失了,如何也补不上,这给后续统计分析增加了难度。再比如,产品已经上市了,需要增加新的统计数据,不得不等待下一个版本增加埋点。

所以,在方案设计、排期开发、测试、上线的整个流程中都要有数据人员参与,一旦养成这个习惯,会很轻松地完成迭代,也不会出现沟通错位,或者是事后诸葛亮的问题。

两大核心模块构建杏树林数据驱动系统。杏树林大数据平台分为两个核心模块,一边是以神策数据为主的分析系统,还有一边是Analytics DB为主的数据库。

0?wx_fmt=png

首先,将一切行为数据(如:iOS、安卓、网络时间等)都报进神策系统。同时,使用 RabbitMQ(应用程序对应用程序的一种通信方法)、Kafka(一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据)来做平常的业务行为和业务日志的采集,可以不用埋点直接把相关的日志数据接入到这两个系统中。

其次,在 Analytics DB (分析数据库)实现代码质量监控、JIRA(项目与事务跟踪工具)接入、电子表格数据导入等操作,便于后期进行可视化展现和分析。

最后, Analytics DB 和 神策数据之间会有非常紧密的联系。这主要是因为神策数据提供了非常强大的计算能力,而 Analytics DB 数据库计算能力比较弱,所以会将需要计算的数据导入到神策,计算完成后,再导回到 Analytics DB 中。同时,神策数据本身收集的数据也会最终汇总到  Analytics DB 中。这就是杏树林数据驱动系统的一个概况。

神策数据的分析系统实现深入性的数据挖掘。在产品迭代,优化功能过程中,对于用户分群、不同科室、不同医生访问情况、对产品功能的反馈等,神策数据提供一个非常完善的模型,通过多维度分析很好地达到分析的目的。我们知道,优化一个产品,优化完了之后,不可能再优化第二次,所以无论产品迭代,还是运营活动等都是不复制的。通过神策数据,杏树林将一次性或临时需求从每月的200多个降低到了80个。

0?wx_fmt=png

报表系统实现日常监控。尤其是业务核心指标,需要长期的观察,这个时候需要用到报表系统做深度的报表设计。报表设计选择了最恰当的维度和统计量。通过这些精心挑选的维度和数据,可以让公司人员对日常运营情况了如指掌。

基础设施建设完毕,就可以使用数据来驱动业务了。


数据驱动产品迭代:迅速抓住决策重点

产品全景功能图,快速了解哪个功能才是用户的最爱。下图是公司管理层非常喜欢的产品全景功能分布图:

0?wx_fmt=png

通过这张图,管理层能够迅速知道不同的功能表现出怎样的特性,以及用户喜欢哪些功能,进而辅助战略决策。

产品全景功能分布图为产品优化提供依据。对于低频低留存的功能点D,可以考虑是否将其路径埋的更深一些。比如:大家常见的 “设置” 功能,事实上是一个不常用的功能,可以将入口埋的更深。而对于高频高留存的功能C,和功能I,就考虑将其入口设置的更浅一些,方便用户找到和使用。

产品全景资源分布图,让好钢用在刀刃上。通过产品全景资源分布图,可以知道公司是否将最好的资源花在了那些对用户真正重要的功能上。如图所示:

0?wx_fmt=png
可以看到,横轴是完成需求所需的资源,纵轴是神策数据统计到的这个功能的访问量。每个点的斜率其实就可以反映出这个功能需求的性价比了。通过这个图表,就可以辅助管理层做功能开发的优先级排序了。

0?wx_fmt=png
通过细分构建因果链评估产品迭代效果。举一个例子,产品经理优化了功能A,发现整个APP的周活跃用户量(WAU)增长了,就会认为这是他的功劳。这虽是人之常情,但事实并不一定是这样。影响整个APP活跃用户量的因素有很多,有可能是功能A优化的结果,也有可能是因为做了一场市场活动,或者是遇到了假期等特殊情况。所以,从整体数据来看,很多时候只能找出相关性,只有从细分数据才能找到真正的因果链。

0?wx_fmt=png

从APP整体的活跃度、高频比,一直细分到功能块的功能点的活跃程度、高频比,可以从中找出真正的因果链。 通过功能点A自身的活跃、留存、高频比数据的变化,让产品经理知道功能A的优化是否产生了作用。



数据驱动运营:关注效率和质量


0?wx_fmt=png

运营一般分为两大类:日常运营和运营活动。日常运营,即通过类似内容的更新、用户反馈等工作,判断效率和质量是否提升:更新的频率是否高了?内容的阅读量相比上个月是否上升?

运营活动是周期性的,是对目标、渠道和转化率的优化与评估。拉新促活是重点目标,需要更多的资源投入。每一次运营活动的渠道和转化率评估,则有助于找到更优的导流渠道,优化投入产出比。

运营的绩效并不是工作是否完成,而是效率和质量是否有提升,这才是运营绩效的核心,才能用数据驱动持续前进。



数据驱动技术:提供持续交付能力和快速定位问题


数据驱动和持续交付能力是相辅相成的。持续交付能力的提升,让数据驱动变得高效,而数据本身对于技术团队的持续交付能力也是有帮助的。

除此之外,技术负责人可以通过这些报表来判断迭代是否稳定、持续交付能力是否得到改善,从而优化整个团队的工作。

此外,杏树林通过报表和数据来优化产品的性能和可靠性。比如,一个功能的响应速度从4.5版本的800毫秒下降到400毫秒,但是在后续更新后的版本中,这个响应速度又飙升上来。此时,则需要通过数据来找到具体原因,快速定位问题。

通过神策分析,点击进入不同版本中,来查看具体的数据,进而发现真正的问题点,然后对症下药。

此外,通过数据还可以看到在具体功能点上投入的技术资源,最终产生实际效果的增长情况,帮助公司将有限的技术资源投入到更有产出比的项目上,提升整体的技术产出能力。

在不断实践中摸索数据驱动“心法”。若将数据驱动比作神功,修炼神功有两个要点:一个是招式,另一个心法。招式对应的是实战案例,心法对应的是方法论。招式每个公司都是不一样的,最终起决定作用一定是心法本身,背后的方法论。孙文亮强调,只有在不停的实践中,才能发现属于自己的“心法”,而这个“心法”并不是换到任何一个环境下都是通用的。希望大家每个人都能快速找到自己的“心法”。

点击下方“阅读原文”,下载杏树林数据分析负责人孙文亮的演讲PPT哦~


0?wx_fmt=gif

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值