内容简介
摘抄语录
- 我理解的数据产品是可以发挥数据价值去辅助用户做更优决策的一种产品形式。它在用户的决策和行动过程中,可以提供更多的分析展现和数据洞察,让数据更直观、高效地驱动业务。
- “If you can’t measure it,you cant’t improve it”,如果你无法衡量,你就无法增长。
- 做任何决策都需要明确目标。
- 产品经理就是发现问题,并制定一套解决方案,组织一些人一起去解决问题,然后再持续不断地解决方案进行优化和改进。
- 马化腾说过,产品经理最重要的能力是把自己变傻瓜。周鸿祎也提出,一个好的产品经理必须是白痴和傻瓜状态。
- 用户思维代表的是用户的心理模型,产品思维代表的是假设的用户模型,工程思维代表的是真实的实现模型,而且产品经理要善于转换思维。在擅长的领域,我们的思维往往是产品思维和工程思维,当转换到不懂的领域时,看待这个领域事情的思维就变成了用户思维,要时刻保持一个空杯心态。
- R软件可视化包如:graphics、lattice、plotrix、plotly、REmap。常见的数据挖掘方法:KNN(k-NearestNeighbor)算法、Logistic回归算法、决策树、朴素贝叶斯算法、神经网络算法。
- 产品需求来源:用户调研、竞品分析、用户反馈、头脑风暴、数据分析。需求类别:提数类、数据接口类、数据分析类、产品功能类、数据优化类。
- 建设需求池的标准、需求归类、需求内容、需求优先级、需求对接人、需求确认日期。还要考虑应对计划之外的情况。
- 需求文档包含的模块有需求/产品概况、文档迭代记录、需求/产品背景、需求/产品定位、需求/产品优先级、需求内容。
- 快速成长要养成复盘总结的习惯。沟通要多想,多看,多说,多总结。项目推动能力产品经理要提炼项目的全局价值,拆解项目需求具体化。要多与人沟通,不要偏执,在相信数据之前,要有勇气否定自己的一些经验和想法,做到时常关注数据,多思考数据背后的东西。
- 数据产品经理要能够规划并定义适合公司业务发展的数据产品,并能够深刻挖掘需求,推动数据产品的落地与不断优化迭代。
- 预估DAU-回归分析,线性和非线性,时间序列;预估活动效果:分类函数,决策树,朴素贝叶斯、KNN、神经网络;预估目标用户群:聚类分析:K均值聚类、分布估计聚类;推荐-关联分析,购物篮分析、属性关联分析。
- 频繁项集:经常出现在一起的物品的集合;关联规则:暗示两种物品之间可能存在很强的关系。
- spark是一个开源的集群计算环境。提供实时内存计算,会比Hadoop中MapReduce速度更快。启用分布数据集,在处理某些工作负载方面表现得更加优越,交互也会更好。
- 原始数据层:基础日志数据,业务线上库,其他来源数据,基础数据规范,ETL处理。数据仓库:基础层-全局数据模型、全局的数据规范;主题层-数据主题模型、画像表;数据集市-数据汇总模型、维度数据。数据应用层-大数据分析平台、行为分析平台、数据挖掘、线上服务、营销平台。
- 数据仓库是为了方便企业快速做各种业务决策提供数据支撑而构建的集成化数据环境。
- 数据集市也叫数据市场,主要功能是将主题层和基础层的数据按各业务需求进行聚合,生成宽表和cube,并直接推送给数据分析和业务部门使用。一定程度上缓解访问的速率瓶颈。
- 统计的数据难免有差异,不要纠结两者的数据为什么对不上,而更应该结合两者互相验证。
- 主要的埋点事件分为点击事件,曝光事件和页面停留时长三类。
- 指标字典,是业务数据标准化的基础,目的是对指标进行统一管理,方便共享,达成对业务指标的共识,并且统一修改和维护。
- 建立指标字典的要素:指标名称、别名、含义、指标类型、限定条件、限定维度。指标字典的维度:时间-时段、日、周、月、季、年。指标字典的量度:流量(PV、DAU、点击设备数、展示设备数、CTP)。
- 数据质量中心:全局数据应用-日志扫描、血缘分析;元数据管理-日志管理、数据仓库管理、数据系统管理、其他元数据管理;全局数据接口-元数据API、标准开放API。
- 数据管理系统的功能主要分为数据流管理、任务管理、数据管理三大功能。数据血缘关系会首先通过指标对应的库表关系,找出它所属的表,再根据计算关系找到计算过程中与它有关联的表,最终把整个链路上的相关表展现出来。
- 大数据分析平台实现数据的共享和交换,提供分析与决策能力,支撑业务飞速发展。
- 看板可以供不同的业务人员实现不同的使用场景:1)产品经理的可能是项目的核心指标;2)市场人员的可能是监控各个渠道来源指标以及转化率情况;3)销售人员的可能是潜在客户的活跃度。
- 智能化分析平台不仅仅是单纯展现数据,还要能够为数据分析师。业务人员提供更多对数据的洞察,让数据更加智能化。例如对数据多维度下钻、对数据异常点进行标注、指标异常检测等。检测异常的方法:基于模型;基于邻近度;基于密度。
- 业务场景分析平台沉淀的一套固定的分析思路和分析架构,如渠道分析、用户留存分析、用户活跃分析及日常的周月报。
- 移动端大数据分析平台满足各方业务人员随时随地发现问题,输出管理压力,促进业务达成。
- 大数据走进传统行业:提高企业生产效率,提升产品质量、利用数据精细化管理,降低生产成本、为产品创新提供数据依据,根据需求迭代产品。
- 用户行为分析平台发现用户的行为规律、对产品功能的使用喜好程度、把结果应用于产品的营销运营及产品版本优化中,实现数据驱动,获得更多用户与更好的体验。
- 电子商务领域特别关注获客成本,用户的留存率,活跃度和用户生命周期价值等指标,这些都会影响网站的GMV和盈利能力。
- 互联网金融:获客(需求判断)-核身-反欺诈(欺诈评分)-准入/授信(风控评分)-增信提额-贷后管理(异常行为预警)-逾期催收(还款潜力评估)。
- 留存分析:起始事件用来圈定研究的目标用户群,在其后第N天做了产生回访事件的用户则算作产品的N日留存用户。
- 转化分析:窗口期指用户完成转化的时间,统计范围指在本次转化分析中研究的用户所在的时间范围。
- 用户行为路径用来追踪用户从某个事件开始到某个事件结束过程中所经历的所有路径,是一种检测用户流向,从而统计产品使用深度的分析方法。如APP核心模块的到达率提升、特定用户群体的主流路径提取、APP产品设计的优化与改版等。
- AB实验创建流程:分析现状;建立假设;设定实验指标;设计实验方案;创建实验;分析实验效果;显著性达95%以上便可逐渐全量上线。
- AB实验分流设计是最重要的模块,核心思想就是将参数划分到N个子集中,每个子集都关联一个实验层,每个请求都会被N个实验处理,每个实验都只能修改与自己层相关联的参数,并且同一参数不能出现在多个层中。
- 对于离线指标,不仅要能够展现指标的统计值,还要能够展现指标的P-Value和置信区间。