- 博客(8)
- 收藏
- 关注
原创 白话数据产品(三)——数据立方体(指标系统)
一、指标系统介绍从直观上来理解,报表系统中的每张报表是通过一些SQL语句计算出来的,系统只要每天按照每张报表的SQL定时去跑数据就可以了。但是随着时间的推移,报表数量越来越多,每天的定时SQL任务跑不动了。但是会发现其实很多报表用到了类似的指标,可能维度不同或者可能完全相同。这时候就需要升华一下方案,将报表的计算,细化到指标的计算上。上述问题的解决需要通过一套完善的指标管理服...
2018-12-01 09:03:52
1165
原创 白话数据产品(二)——SQL入门
作为数据产品,一项基础工作即是为需求方取数据,一般来说简单的取数数据产品是要兼顾的,复杂的取数才会升级到研发来取,毕竟研发们都很忙嘛,小事我们自己也可以搞定的。一、SQL思路3分钟入门SQL可以实现的功能很多,建表、删表、插入数据、查询数据...这里主要介绍查询数据的SQL一般写法,SQL语言的主要逻辑也是在查询语句这一块。传统MySQL类数据库或大数据中,用到的Hive数据库是按行索...
2018-12-01 08:59:29
303
转载 ubuntu12.04简单配置
1,简单配置http://www.linuxdiyf.com/bbs/thread-274405-1-1.html 2,Ubuntu 12.04 Unity返回到经典Gnome桌面sudo apt-get install gnome-session-fallback 3,无线灯闪烁(12.04测试通过) sudo -iecho 'options iwlagn le...
2018-12-01 08:57:14
410
原创 白话数据产品(一)——数据仓库
数据产品的工作比较杂,从数据仓库建模,指标体系建立,到数据产品工具的设计,再到偶尔一些数据分析报告的撰写,甚至一些机器学习的预测模型都要有所了解。大公司可能每个职能都有专门的岗位来负责,小公司的话可能真的要你一条龙了。其实数据产品从头到尾做的事情就是帮公司收集数据、存储数据、呈现数据、预测数据,拆分到具体的工作中,将会在下面介绍。收集和存储数据:数据仓库数据仓库是存放收集来的数据的地方...
2018-12-01 08:54:16
485
转载 linux常用软件
文档编辑:troff, LaTeX, SGML幻灯片:ConTeXtPDF, PS, DJVU 文件:Acrobat Reader, xpdf, GhostScript, gv, djvu工具包和netscape 插件绘图:xfig,dia,MetaPost图像处理:ImageMagick,Gimp自动管理工具:makeemail:Mutt ,postfix,
2012-04-28 12:10:38
447
转载 ubuntu初学者常用命令
NO 分类 PS1 命令名 用法及参数 功能注解 1 文件管理 # ls ls -a 列出当前目录下的所有文件,包括以.头的隐含文件 文件管理 # ls ls -l或ll 列出当前目录下文件的详细信息 文件管理 # pwd pwd 查看当前所在目录的绝对路经 文件管理 # cd cd .. 回当前目录的上一级目录 文件管理 # cd cd - 回上一次所在的目录 文件管理
2012-04-14 15:00:50
287
转载 ubuntu下rpm包安装+alien安装+deb包镜像站
转换为DebUbuntu的软件包格式是deb,如果要安装rpm的包,则要先用alien把rpm转换成deb。sudo apt-get install alien #alien默认没有安装,所以首先要安装它sudo alien xxxx.rpm #将rpm转换位deb,完成后会生成一个同名的xxxx.debsudo dpkg -i xxxx.deb #安装注意,用alien转换的
2012-01-07 20:53:00
4013
转载 linux多个python版本共存切换方法
python命令通常存在/usr/bin/python和/usr/local/bin/python下面,一般是符号链接,优先使用后者,如果有2.6和2.7两个版本,并且/usr/bin/python --> /usr/bin/python2.6/usr/local/bin/python --> /usr/local/bin/python2.7此时系统默认使用2.
2012-01-07 20:48:29
7528
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人