Storm【实践】系列- 我们实践业务的背景

本文介绍了大数据实践系列的内容规划,包括Storm实时大数据处理、Impala数据仓库体系建设及Spark离线挖掘系统等,并通过具体案例展示了访客分析、订单分析及商品分析等应用场景。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

【实践系列介绍】:

       各位看官,本ID描述的【大数据数据实践】系列,目前暂定为三期工程:

      1 期  : Storm 实时大数据处理

      2期   :impala 数据仓库体系建设

      3期  :Spark离线挖掘系统以及Storm数据推荐系统


       此系列博文将持续更新,对更新的频率本ID暂定:

        1 : 如果属于代码阶段,那本ID将保证每日一篇


        2 :如果属于业务梳理阶段,本ID将每星期做一次背景介绍:

                        首先:业务的梳理需要持续的思考,阶段性的思考未必准确,即便贴上博文,价值也不太大。

                        其次:具体的代码实现,将力争每日一篇,如果未有及时跟新,本ID也将及时回补。


  本章内容:

            

                 到目前为止,我们的数据模型为:PhPStat网站浏览统计系统,网址为:

                  http://www.topstat.cn/login.php?ln=demo&lp=demo123


                  点击页面进入153609_UYQX_1791874.png

                

                 153757_Vz0C_1791874.png

请你点击电分析

我们将查看154114_IKK5_1791874.png

我们在目前需要做的大概有三个主要的模型

      其一: 访客分析

      其二:订单分析

      其三:商品分析

                       所谓的访客分析就是我们的浏览日志,在浏览日志之中,同样包括了一些商品信息

                        另外的一部分是属于订单信息,订单信息是对于我们订单业务的一种描述。


         在这里我们举个例子说明:  

         订单数据原始格式:

                155525_UD1K_1791874.png

指标:订单金额,订单次数,是否付款,付款金额

     

      简单的浏览原始数据格式

155525_UD1K_1791874.png

 指标:

 155917_HYYl_1791874.png


也就是说我们目前的功能,在报表之中,是一个多属性查询的问题? 对于当个维度下的,多个维度下【一般少于三个维度】会进行维度拆分。

 在Storm之中有没有没有更好的办法来处理全属性查询?

转载于:https://my.oschina.net/infiniteSpace/blog/289755

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值