
数据分析
文章平均质量分 83
人工智能取经人
这个作者很懒,什么都没留下…
展开
-
Python自动化:轻松解决Excel表格差异对比难题,告别手工核对的烦恼!
我们有一个专门的技术社区群,在这个群里有很多像这样热心的技术大佬,大家分享着各种实用的Python自动化办公代码和技巧。如果你也想让自己的办公变得更加轻松高效,欢迎加入我们的社区群,和其他打工人一起探索Python自动化办公的奇妙世界。原创 2025-03-15 14:40:37 · 554 阅读 · 0 评论 -
四步成诗:搭建数据运营指标体系
“数据”本身只是工具,而运营和业务才是重点。“数据化运营”能力,就像逻辑思考与沟通表达一样,是当下每个互联网人都应当具备的思维能力,帮助我们摒弃“拍脑袋”做决策的习惯,能够有理有据地去解决业务问题。不同岗位职责不同,但万变不离其宗,本质上大家关注的都是获客、留存、营收,围绕数据观测指标,然后进行业务分析,再以此完成各种运营动作,其核心路径可总结为:设定指标 → 分析洞察 → 运营策略,其中指标体系就是业务的逻辑框架也是思考业务逻辑的第一步。原创 2025-03-13 11:43:56 · 940 阅读 · 0 评论 -
如何用“金字塔原理”撰写数据运营分析报告
数据分析报告,顾名思义是将运营过程中发生的各种业务场景合理地组织起来,合理的呈现出来。根据业务发生的时间又可以分为总结型、决策型、规划型。数据分析报告是根据数据分析原理和方法,运用数据来反映、研究和分析事物的现状、问题、原因、本质和规律,并得出结论,提出解决办法的一种分析应用文体。原创 2025-03-12 16:53:51 · 745 阅读 · 0 评论 -
业务数据分析极简通用方法论
看完本篇文章,相信你现在遇到问题,很快就能组织出分析思路。简单来说,你只要解决以下 5 个问题就可以了,它们分别是:要解决的问题是什么?为什么要分析这个问题?问题的表面原因是什么?问题的根本原因是什么?要解决问题该怎么办?原创 2025-03-12 16:30:43 · 1013 阅读 · 0 评论 -
从0到1构建业务分析模型
众所周知,数据分析是一门注重业务经验的学科,数据分析师的最核心能力是如何将业务问题转化为数据分析问题,本篇文章从实际业务出发,立足具体案例,总结一些实用的数据分析模型原创 2025-03-12 14:31:53 · 374 阅读 · 0 评论 -
目标思维——数据分析源自问题,高于问题
最重要的,目标思维还能让你更有钱。哈佛大学曾做过一次研究,毕业生中只有不到百分之三的学生对未来有清楚明确的目标。二十年后,这百分之三的学生更成功,也更快乐。而且,这百分之三的人的财富总和,居然大于另外百分之九十七的所有学生的财富总和,而这就是目标的力量。几乎所有的事,搞清楚目标之后,做起来的难度就会直线下降。原创 2025-03-12 14:28:26 · 814 阅读 · 0 评论 -
数据运营:如何从零搭建数据运营体系
数据运营从传统运营发展而来的,主要的区别在于数据运营是利用数据驱动,通过数据做好运营监控、原因排查、策略执行等一系列的运营动作,响应速度和迭代效率相比传统运营更高。数据化运营体系就是做数据化运营的数据支持和流程方法。不同的运营方向都可以做数据化运营,比如渠道运营可以建设渠道运营的数据运营体系,用户运营可以建设用户运营的数据运营体系。原创 2025-03-12 14:13:38 · 606 阅读 · 0 评论 -
HR是如何提前预知我的离职倾向的——UEBA,基于Python实现的行为异常检测
UEBA是大数据分析、机器学习、人工智能技术在网络安全和内部管理方面应用的典型体现,本文用python实现其中基线分析与对等组分析这两大最核心的技术,当然这只是UEBA的冰山一角。原创 2025-03-06 17:12:22 · 448 阅读 · 0 评论 -
遗传算法解决最优化问题——基于python实现
最优化理论与算法是一个重要的数据分支,也可以认为是运筹学。涵盖线性规划、非线性规划、整数规划、组合规划、图论、网络流、决策分析、排队论、可靠性数学理论、仓储库存论、物流论、博弈论、搜索论和模拟等分支,它所解决的问题是如何在众多的方案中找出最优方案。比如:工业设计中如何选择设计参数,使得设计方案既能满足要求又能降低成本;资源分配中,如何分配有限资源,既能满足需求又能得到最大的经济效益。原创 2025-03-06 17:08:39 · 459 阅读 · 0 评论 -
Easy ABTest
原则二:在做实验的时候要选择不同类型城市(一般公司都会有一个城市分级,会依据城市的不同属性分为一级二级三级城市等等,不同的公司分级标准不同,使用自己公司的分级标准即可),实验策略可能对不同类型的城市有不同效果,需要通过选择不同类城市,使实验具有普适性。在样本量足够大的,p 值就会趋近于0,任何策略都在统计学意义上是显著的。通过计算得出,z=1.34,小于图中的 1.96,没有落到拒绝域中,因此我们不能拒绝原假设,那么我们可以得出结论,这个产品经理的功能改版 95% 的可能性来说,是没有提升 DAU 的。原创 2025-03-06 17:00:38 · 710 阅读 · 0 评论 -
一套实用的时间序列数据异常检测算法
异常检测的场景很多,例如:硬件的故障检测、流量的异常点的检测等场景。针对时间序列类数据的异常检测算法也有很多,业界比较流行的比如普通的统计学习方法--3σ原则和箱线图识别数据离群点,它利用检测点偏移量来检测出异常。比如普通的回归方法,用曲线拟合方法来检测新的节点和拟合曲线的偏离程度,还有人将CNN 和 RNN 技术应用到异常点的检测,但笔者通过大量的实践经验发现以上做法要么识别效果较差【比如:统计学习方法、回归方法】,要么部署难度较大【比如:RNN、CNN等】。原创 2025-03-05 10:38:45 · 817 阅读 · 0 评论 -
指标权重计算的几种常用方法及Python代码
在统计理论和实践中,权重是表明各个评价指标(或者评价项目)重要性的权数,表示各个评价指标在总体中所起的不同作用。在具体业务场景中,最常见的评价指标类型分为:单层指标体系和双层指标体系。原创 2025-03-05 09:39:11 · 233 阅读 · 0 评论