
大数据
文章平均质量分 90
话梅姐姐呀
这个作者很懒,什么都没留下…
展开
-
智慧园区打造
一、需求挖掘及客户引导1、社区的日常”内容“1.1、人员进出a、早上:住户出门,乘坐电梯,出楼宇,走到小区大门,走人行,经过大门口,跟门卫保安打下招呼;b、晚上:住户从外回来,跟门卫打招呼,走进大门口,经过人行道,进入对应楼宇,乘坐电梯,进房门;c、吃饭时间:点了外卖,外卖小哥到小区门口,门卫保安看到后直接放行,到对应楼宇上电梯,到用户门口按门铃,送到后出小区;d、吃完饭:住户乘坐电梯到地面层,在路灯的照明下,休闲走动,然后乘坐电梯回到房间;e、晚上11点:小区保安日常绕小区一周原创 2021-12-04 23:26:03 · 5707 阅读 · 1 评论 -
数据仓库笔记(高质量建模)04——元数据管理
一、元数据定义Information about data ,中介数据、中继数据,指用于描述数据的数据,用于描述数据数据属性的信息。用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。【信息来源百度百科】二、元数据的分类元数据按照功能分类,可分为3大类:1、Business Metadata(业务数据)2、Technical Metadata(技术数据)3、Operational Metadata(操作数据)1、Business Metadata(业务数据)广义来讲,原创 2021-11-29 09:42:41 · 720 阅读 · 0 评论 -
数据仓库笔记(高质量建模)02——数据规范
数据规范前,需注意:1、列出实体:名词(表)2、勾勒出关系:动词3、尽量消除多对多关系4、列出所有属性(列)数据规范需满足:1NF >2NF >3NF >BC NF (3.5NF) >4 NF > 5NF一般能做到满足3NF就行。一:第一范式:1NF原子性:没有重复的列,列不可再分,没有重复的行1、数据规整成二维表格2、确保每一列表达的不同含义的数据3、去掉多值属性,拆成多列(如地址会拆分到街道办,之前可能就是地址一栏,现在有很多原创 2021-11-27 23:19:58 · 844 阅读 · 0 评论 -
数据仓库笔记(高质量建模)——01
接下来写随手写一些上课笔记,就当作在学习探索~存在些理解错误或偏差,也会记录些问题,看到的小伙伴懂的话可顺便给个回复或纠正些问题,看了哪些不懂的伙伴也可以留言,看到后会给回复(有些不大懂的就略过啊~)一、数据时代的演变票据——> 在线业务处理(OLTP)——> 数据分析查看(OL AP)这时候的数据特点:1.1、数据量大,如阿里巴巴亿级别;1.2、海量并发1.3、数据格式相对丰富:视频、音频、文本等(结构化与非结构化均有,只有只有结构化数据),如可通过视频解析球员在球原创 2021-11-23 12:08:51 · 871 阅读 · 0 评论 -
浅谈智能推荐
前言微视为啥不能打败抖音,微信这便是智能推荐的威力所在。据公开资料记载:而今年3月份抖音日活用户数量约为6.1亿至6.2亿。微视日活3亿(微信月活跃数达12.25亿,超过中国网民的总体数量9.89亿)。定义及其运行原理智能推荐,其本质为过滤系统,人货场则是该过滤系统的三大基本因素。人:如何精准获取用户需求;货:如何细致而全面描述产品(有形的物品、无形的服务与信息、组织等)场:如何给用户推荐合适的产品1、如何获取用户需求用户需求来源于用户身上,需要了解用户需求,那便看你对用户有原创 2021-09-06 23:27:43 · 4490 阅读 · 0 评论 -
浅谈大数据业务处理流程
离线数据处理流程离线数据处理一般经过:数据采集 ,上传后台服务器,这是数据不会直接被处理掉,而是形成日志、行为数据等分析好的包,上传到互联网数据中心IDC(也就是机房)。1、数据采集数据一般可通过日志、埋点、第三方、外部数据等方式获取。而埋点一般是指Web/App端想通过日志获取的数据技术上存在一定的难度。这里所谓的难度,需要根据开发同事反馈确定:如想要获取用户订单数、或是歌曲播放量等数据,通过日志就能很容易获取,这时候就不必埋点,但是要获取视频的播放时长、页面点击等操作,日志获取就有一定的技术难度,原创 2021-01-03 13:15:01 · 3063 阅读 · 8 评论