
数据分析及可视化
文章平均质量分 85
数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息。但是,这并不就意味着数据可视化就一定因为要实现其功能用途而令人感到枯燥乏味,或者是为了看上去绚丽多彩而显得极端复杂。
G皮T
计算机科学与技术本科,计算机技术硕士,现任职于某互联网公司,担任测试开发工程师。优快云云原生领域优质创作者、博客专家。书籍《大数据测试开发工程师的第一本书》正在积极撰写中,敬请期待。微信公众号:大数据与AI实验室。《Java 百“练”成钢》连载中,欢迎关注!
展开
-
【归因分析】网易云音乐用户行为归因数据体系建设
云音乐的数据接入包括客户端日志、服务端日志、算法标签以及业务库的数据。数仓核心资产的建设采用标准的 DIM-DWD-DWS 层次架构。首先对客户端日志、服务端日志进行整合,构建统一的公共流量模型和异常数据清洗机制,随后将流量数据细分为不同流量场景和流量事件的 DWD 层;基于算法标签构建 oneID、oneIP 等新资产的 DWD 层;基于业务库接入业务事件构成 DWD 层。原创 2024-05-03 21:11:56 · 1461 阅读 · 0 评论 -
【数据分析】为什么要学习分析方法?
分析方法就好比在盖房子前画的设计图。用来指导如何盖房子是分析问题的思路。数据分析的技术工具好比盖房子中的挖土机等工具,在设计图的指导下才知道如何使用挖土机来盖好房子。同样,在分析方法的指导下,才能知道如何使用工具去分析数据,解决业务问题。原创 2021-08-24 17:25:05 · 416 阅读 · 1 评论 -
【数据分析】数据分析方法(一):5W2H 分析方法
虽然 5W2H 分析方法很好理解,但是在复杂的商业问题面前不起作用。这是因为复杂的商业问题不会只有一个原因,而是由多个原因引起的。原创 2022-06-06 17:31:09 · 2474 阅读 · 1 评论 -
【数据分析】数据分析方法(二):逻辑树分析方法
不管是在实际生活中还是工作中,我们经常会使用逻辑树分析方法来分析问题。逻辑树分析方法是把复杂问题拆解成若干个简单的子问题,然后像树枝那样逐步展开。原创 2022-06-06 21:23:26 · 2049 阅读 · 1 评论 -
【数据分析】数据分析方法(三):PEST 分析方法
PEST 分析方法是对公司发展宏观环境的分析,所以经常用于行业分析。通常是从政策、经济、社会、技术这四个方面来分析的。原创 2022-06-10 00:14:30 · 4969 阅读 · 1 评论 -
【数据分析】数据分析方法(四):多维度拆解分析 & 对比分析
对于多维度拆解分析方法,要理解两个关键词:维度、拆解。只看数据整体,我们可能注意不到数据内部各个部分构成的差异,如果忽略这种差异进行比较,就有可能导致无法察觉该差异所造成的影响。另外,遇到一个复杂问题不知道怎么解决的时候,我们可以用多维度拆解分析方法,将一个复杂问题变成可以解决的子问题。原创 2022-06-10 11:43:19 · 4990 阅读 · 1 评论 -
【数据分析】数据分析方法(五):假设检验分析方法
假设检验分析方法的底层思想其实很简单,就是逻辑推理。这个逻辑推理在我们生活中无处不在,如果你看过《神探狄仁杰》、《白夜追凶》、《唐人街探案》这些破案片,就会发现剧中的破案高手都有一个破案套路,那就是先假设某个人是嫌疑人,然后找证据。如果有足够的证据证明该嫌疑人犯罪,才宣判嫌疑人有罪。原创 2022-06-10 12:17:58 · 1888 阅读 · 1 评论 -
【数据分析】数据分析方法(六):相关分析 & 群组分析
当我们研究两种或者两种以上数据之间有什么关系的时候,就要用到相关分析。在解决问题的过程中,相关分析可以帮助我们扩大思路,将视野从一种数据扩大到多种数据。原创 2022-06-10 14:46:19 · 1385 阅读 · 1 评论 -
【数据分析】数据分析方法(七):AARRR 模型分析 & 漏斗分析
漏斗分析的作用是定位问题节点,即找到出问题的业务环节在哪。漏斗分析常用于用户转换分析,或者用户流失分析,所以漏斗分析中要关注两个指标:用户转化率、用户流失率。原创 2022-06-10 15:17:08 · 5482 阅读 · 2 评论 -
【用户增长】用户增长方法论及增长思维
综上三点,我们可以简单的将用户增长定义为:通过痛点、产品、渠道、创意、技术、数据等要素,实现用户的获取、激活、留存、变现、推荐的增长体系。原创 2022-06-13 15:52:56 · 4638 阅读 · 4 评论 -
【用户增长】找到用户增长的根本动因
近几年创业的人越来越多,在这些创业失败的案例中,不乏一些 UI 设计非常漂亮的产品,但最终却因为用户增长做不起来而导致创业失败。这些产品失败的最主要原因就是没有找对痛点。原创 2022-06-17 11:18:48 · 1598 阅读 · 1 评论 -
【数据分析】业务指标的几个相关思考
拿到数据后,第一步,弄清楚数据里每一列的含义;第二步,对数据进行分类,有助于后期的分析。通常将数据分为 用户数据,行为数据,产品数据 三类。原创 2022-05-16 23:38:54 · 599 阅读 · 1 评论 -
【数据分析】如何构建指标体系并设计一份优质报表
类似于周报、月报等常规的报表,数据内容和规定相对固定,比如部门周会要看的数据周报,这样的数据分析报告,更多的是让产品人员、运营人员和数据分析师针对近期数据形成统一的认知。如何聚焦于某个点给出分析数据,比如新功能上线后的数据分析报告、运营活动效果的分析报告等,其中一个最核心的问题就是如何提高质量。原创 2022-05-12 23:00:24 · 2687 阅读 · 0 评论 -
【数据分析】初识 AB 测试
AB 测试是指为了评估模型 / 项目的效果,在 APP / PC 端同时设计多个版本,在同一时间维度下,分别让组成成分相同(相似)的访客群组随机访问这些版本,收集各群组的用户体验数据和业务数据,最后分析评估出最好的版本正式采用。原创 2022-05-13 22:02:54 · 1241 阅读 · 1 评论 -
【数据分析】基于RFM模型的线上零售中的客户细分(一):客户细分
RFM模型通常被用来衡量客户价值和客户创利能力,是商业数据分析中的重要工具和手段。这次我将使用RFM模型对线上零售数据进行客户细分。原创 2021-01-29 20:22:32 · 3273 阅读 · 1 评论 -
【数据分析】基于RFM模型的线上零售中的客户细分(二):RFM模型实战
这篇博客将会结合具体的商业实例介绍同期群分析、RFM模型,并利用K-Means聚类算法在RFM模型上找到合适的细分集群。原创 2021-02-01 12:47:10 · 4632 阅读 · 5 评论 -
【数据可视化】基于 Dash 制作的疫情数据可视化 APP(Dash 入门必读,附可运行源码)
本篇博客,我将利用一种新的方式——Dash,来构建一个疫情数据可视化APP。Dash与Streamlit相比又有何优缺点呢?让我们一起来看看吧!原创 2021-02-21 00:12:17 · 10927 阅读 · 35 评论 -
【数据可视化】利用 Flourish 制作动态排名条形图(无需代码,超简单)
数据可视化不仅是一项技术,也是一门艺术。当然,数据可视化的工具也非常多,仅 Python 就有 matplotlib、plotly、seaborn、bokeh 等多种可视化库,我们可以根据自己的需要进行选择。但不是所有的人都擅长写代码完成数据可视化的工作,这个时候我们可以考虑一些其他的数据可视化工具,比如本文要介绍的 Flourish。原创 2022-05-23 23:37:31 · 16834 阅读 · 8 评论 -
【数据可视化】基于 Scattertext 的《十二五和十三五规划》文本分析
二〇二一年是十四五规划的开篇之年。十二五和十三五规划的对比研究对开展和实施十四五规划有着非常重要的指导意义。原创 2021-02-17 14:53:47 · 3540 阅读 · 4 评论 -
【数据可视化】利用 WordCloud 制作词云
利用 WordCloud 制作词云原创 2021-03-20 15:10:19 · 7139 阅读 · 1 评论 -
【读书笔记】舆情分析浅谈:读《论新媒体发展背景下网络舆情的发展及治理》有感
新媒体技术的快速发展,给网络舆情的发展及治理带来的既有机遇也有挑战。网络舆情作为公众情绪与态度的外在化表现,对社会的治理及社会的长治久安产生了深远的影响。新媒体背景下的新时代,需要社会及公众理性地看待。原创 2021-03-09 23:21:01 · 1052 阅读 · 1 评论