前言
你是否每日都花费大量时间做着各种报表,被小伙伴们亲切的称为:“表哥”“表姐”
你是否经历过数据太大导致Excel程序卡死,做了一上午的成果付诸东流(额的神啊 ̄へ ̄)
你是否经历过因长时间盯着各种表导致眼花缭乱,弄错公式,数据出错,闹出笑话
如果以上几个场景你都经历过,或是正处在这个阶段,那么这篇文章可能对你有点帮助。
本文结合实际工作场景,从数据获取一数据清洗—模型搭建(计算)—数据可视化,展现自动化展示的完整过程,过程虽简单,希望大家可以由简入深,各有所得。
注:文章所有数据均为虚拟数据
正文
工具及第三方库:MySQL Jupter Notebook ;Pandas numpy pyecharts
在文章开始之前,先简要介绍一下业务场景及整体思路:
业务场景:
在线教育行业,用户转化关键指标主要有:用户注册数、用户试听数、用户成单数,由此制作一个漏斗图可以很直观的展示连续业务流程节点转化情况。
整体思路:
一、获取数据
首先从数据库中导出“注册表”“试听表”“成单表”,然后使用Pandas导入等待处理
import pandas as pd
import numpy as np
from d