目录
一、观测
(一)观察
采集数据:解析系统日志、埋点获取新数据、通过传感器采集(譬如天气、智能手环)、爬虫(解析网站、抓取数据,不太合法)、API(Application Programming Interface应用程序接口,按照规则提供数据)
储存数据:各种类型的数据库(Hive,mysql,sqlserver),连接数据库取数
展示数据:可视化高效传达信息,
(二)测量与分析
分析数据的目的是什么?
- 及时发现异常
- 找到数据之间的因果关系
数据是客观统一的,有统一的认知才能有共同的目标。
设定标准+发现异常+研究关系
二、实验
提出假设,然后验证假设
例子:观测到外卖差评率飙升,假设由恶劣天气导致骑手迟到引起,通过天气数据验证假设
所有未经实时数据验证的想法都是假设。
设计A/B测试获取数据
如何在业务只有少量数据时设计数据实验?
如何在无法同时测试两个版本时比较数据?
(以后解决)
三、应用
如何应用数据创造价值?
- 基于数据反馈不断迭代产品和业务策略。
- 基于数据训练算法,让机器自动化完成工作。
(一)第一个方向
拆解方法:流程拆解法、二分法、象限拆解法、杜邦分析法
流程拆解法是一种将复杂的任务或问题分解成更小、更容易管理的子任务或步骤的方法。这有助于提高任务的可管理性,减少混淆和错误,并更好地组织工作。通常,流程拆解法包括以下步骤:
1. 确定任务或问题:首先,明确要处理的任务或问题是什么,确保理解整体目标。
2. 分解任务:将整体任务分解成更小的子任务或步骤,使其更容易处理。这些子任务应该是具体的、可测量的。
3. 制定计划:为每个子任务制定一个计划或时间表,以确保它们按顺序完成。
4. 分配责任:如果有多人参与,确定每个人的责任,以确保任务顺利完成。
5. 实施和监控:执行每个子任务,并确保按计划进行。持续监控进度和质量。
6. 整合结果:将所有子任务的结果整合在一起,以完成整体任务或解决问题。
7. 审查和改进:最后,审查任务的完成情况,了解有哪些改进的机会,以便将经验应用于未来任务。
流程拆解法有助于提高工作的效率和组织,特别是在处理复杂或庞大的任务时。(cr.chatgpt)
二分法,也称为二分查找,是一种用于在有序数据集中查找特定元素的有效算法。其工作原理如下:
1. 首先,确保数据集是有序的,通常是升序排列。
2. 定义要查找的元素,通常称为目标值。
3. 初始化两个指针,一个指向数据集的起始位置,另一个指向数据集的结束位置。
4. 计算中间位置的索引,通常为(起始位置 + 结束位置)/ 2。
5. 比较中间位置的元素与目标值:
- 如果中间元素等于目标值,查找成功,返回中间位置的索引。
- 如果中间元素大于目标值,将结束位置指针移动到中间位置的前一个位置,且下次查找范围是起始位置到中间位置的前一个位置。
- 如果中间元素小于目标值,将起始位置指针移动到中间位置的后一个位置,且下次查找范围是中间位置的后一个位置到结束位置。6. 重复步骤4和步骤5,直到找到目标值或起始位置大于结束位置,表示查找失败。
二分法的主要优点是它可以迅速缩小搜索范围,减少不必要的比较次数,因此在大型有序数据集中查找元素时非常高效。但要注意,它要求数据集必须是有序的。
(cr.chatgpt)
象限拆解法通常用于解决复杂问题,将问题拆解成四个象限或区块,以更有效地分析和解决。这个方法通常在解决问题的初期用来理清思路。以下是象限拆解法的步骤:
1. **确定问题或任务**:首先,明确要解决的问题或任务。
2. **绘制坐标轴**:在一个纸上或数字界面上,绘制一个坐标轴,通常使用一个垂直线和一个水平线相交,以形成四个象限。
3. **分解问题**:将问题分解成四个部分,每个部分放入一个象限。这些部分可以是问题的不同方面、子任务或要解决的具体问题。
4. **分析每个象限**:针对每个象限,分别考虑其内部的问题或任务。这有助于将问题细化,使其更易于处理。
5. **解决每个象限**:处理每个象限中的问题,可以采取适当的方法或策略来解决。
6. **整合解决方案**:一旦每个象限中的问题都得到解决,整合这些解决方案以解决整体问题。
7. **审查和优化**:最后,审查整个解决方案,检查是否有更好的方法或改进的空间。
象限拆解法有助于将复杂问题分解成更小、更易管理的部分,并在解决问题时提供清晰的结构。这是一个有用的工具,特别适用于需要全面分析的问题。
(cr.chatgpt)
杜邦分析法,也称为杜邦财务分析,是一种财务分析方法,用于评估公司的绩效和财务状况。这个方法旨在将公司的财务指标分解为不同的部分,以更深入地了解其盈利能力、财务杠杆和资产管理。杜邦分析法通常包括以下步骤:
1. **确定关键财务指标**:选择一组关键的财务指标,通常包括净利润、总资产、股东权益等。
2. **计算指标**:计算这些指标的数值,通常使用公司的财务报表,如资产负债表和损益表。
3. **应用杜邦公式**:使用杜邦公式将这些指标分解成不同的部分。主要的杜邦公式包括:
- **ROE(股东权益回报率)分解**:ROE = 净利润 / 股东权益。分解为三个关键组成部分:
- 净利润率(Net Profit Margin):净利润 / 总收入。
- 资产周转率(Asset Turnover):总收入 / 总资产。
- 杠杆率(Leverage):总资产 / 股东权益。4. **分析分解的结果**:分析每个分解出的部分,以了解公司在不同方面的表现。例如,净利润率反映了公司的盈利能力,资产周转率反映了公司的资产管理效率,杠杆率反映了财务杠杆水平。
5. **做出结论**:结合分解出的部分和其他相关信息,对公司的绩效和财务状况进行评估,并得出结论。
杜邦分析法提供了深入了解公司财务状况的方法,有助于投资者、分析师和管理人员更好地理解公司盈利的来源和潜在的风险因素。它也可以用于比较不同公司之间的绩效。
然后将数据应用于业务,不断迭代,飞速发展
(二)第二个方法
为算法设定明确的业务目标
↓
为算法提供高质量的数据
↓
判断算法是否真的创造了实际价值
↓
帮助业务更好的使用算法
譬如推荐算法
————
b站up主戴戴戴师兄视频学习记录