【网站点击流数据分析】05-数据仓库设计

本文详细介绍了星型模型在网站日志数据分析中的应用,包括事实表和维度表的设计,如时间维度、访客地域维度及终端类型维度等,通过数据预处理和ETL过程,将原始数据转化为可用于业务分析的格式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

采用星型模型 

1、事实表

原始数据表:t_origin_weblog

valid

string

是否有效

remote_addr

string

访客ip

remote_user

string

访客用户信息

time_local

string

请求时间

request

string

请求url

status

string

响应码

body_bytes_sent

string

响应字节数

http_referer

string

来源url

http_user_agent

string

访客终端信息

 

 

 

ETL中间表:t_etl_referurl

valid

string

是否有效

remote_addr

string

访客ip

remote_user

string

访客用户信息

time_local

string

请求时间

request

string

请求url

status

string

响应码

body_bytes_sent

string

响应字节数

http_referer

string

外链url

http_user_agent

string

访客终端信息

host

string

外链url的域名

path

string

外链url的路径

query

string

外链url的参数

query_id

string

外链url的参数值

 

 

 

访问日志明细宽表:t_ods_access_detail

request_level1

string

请求的一级栏目

request_level2

string

请求的二级栏目

request_level3

string

请求的三级栏目

valid

string

是否有效

remote_addr

string

访客ip

remote_user

string

访客用户信息

time_local

string

请求时间

request

string

请求url

status

string

响应码

body_bytes_sent

string

响应字节数

http_referer

string

外链url

http_user_agent

string

访客终端信息整串

http_user_agent_browser

string

访客终端浏览器

http_user_agent_sys

string

访客终端操作系统

http_user_agent_dev

string

访客终端设备

host

string

外链url的域名

path

string

外链url的路径

query

string

外链url的参数

query_id

string

外链url的参数值

daystr

string

日期整串

tmstr

string

时间整串

month

string

月份

day

string

hour

string

minute

string

##

##

##

mm

string

分区字段--月

dd

string

分区字段--日

2、维度表

时间维度 v_year_month_date

year

month

day

hour

minute

访客地域维度t_dim_area

北京

上海

广州

深圳

河北

河南

终端类型维度t_dim_termination

uc

firefox

chrome

safari

ios

android

网站栏目维度 t_dim_section

跳蚤市场

房租信息

休闲娱乐

建材装修

本地服务

人才市场

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值