
大数据
文章平均质量分 78
大数据
yujkss
这个作者很懒,什么都没留下…
展开
-
ETL数据清洗工具总结
转自:https://www.cnblogs.com/yuyu666/p/10049912.htmlETL数据清洗工具总结【国外】datastage点评:最专业的ETL工具,价格不菲,使用难度一般下载地址:ftp://ftp.seu.edu.cn/Pub/Develop … taStage.v7.5.1A-iSOBT种子下载:http://pan.baidu.com/share/link?shareid=172289&uk=67437475-------------------.转载 2021-03-02 13:21:21 · 2315 阅读 · 0 评论 -
数据仓库建设步骤
1.系统分析,确定主题确定一下几个因素:·操作出现的频率,即业务部门每隔多长时间做一次查询分析。·在系统中需要保存多久的数据,是一年、两年还是五年、十年。·用户查询数据的主要方式,如在时间维度上是按照自然年,还是财政年。·用户所能接受的响应时间是多长、是几秒钟,还是几小时。2.选择满足数据仓库系统要求的软件平台选择合适的软件平台,包括数据库、建模工具、分析工具等。有许多因素要考虑,如系统对数据量、响应时间、分析功能的要求等,以下是一些公认的选择标准:·厂商的背景和支持能力,能否提供全方位的技转载 2021-03-01 20:39:36 · 609 阅读 · 0 评论 -
宽表和窄表
宽表和窄表宽表和窄表的建设该如何选择?原文链接,若侵删https://www.cnblogs.com/Leo_wl/p/8515794.html宽表和窄表的建设该如何选择?这个问题相信纠结了很多从是数据库开发、数据仓库开发和后台开发人员;单单考虑这个问题,难给出一个绝对的答案;本人从事数据仓库开发工作到现在已经有一年半时间了,对于这个问题,我也曾经纠结过,但是是否有绝对的答案呢?事实上任何东西都没有绝对的说法。考虑这样的一个问题,一个公司有这样的一个需求:设计销售领域的订单事实表,该事实转载 2021-02-19 14:03:59 · 816 阅读 · 0 评论 -
ETL讲解(很详细!!!)
ETL讲解(很详细!!!)ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。 ETL是BI项目重要的一个环节。 通常情况下,在BI项目中ETL会花掉整个项目至少1/3的时间,ETL设计的好坏直接关接到BI项目的成败。ETL的设计分三部分:数据抽取、数据的清洗转换、数据的加载。在设计ETL的时候我们也是从这三部分出发。数据的抽取是从各个不同的数据源抽取到ODS(Operational Data Store,原创 2021-01-21 14:48:52 · 1488 阅读 · 0 评论 -
python、java、c、go执行速度对比
java、c、python、go的运算速度对比python版本结论java版本c版本go版本python版本NUM = 111181111 # 这是素数, 因此在循环结束前不会退出def is_prime(n): i = 2 while i < n: if n % i == 0: return False i += 1 return Trueif __name__ == '__main__':转载 2021-01-20 15:13:36 · 4478 阅读 · 2 评论 -
大数据到底应该如何学?
写在前面:博主是一只经过实战开发历练后投身培训事业的“小山猪”,昵称取自动画片《狮子王》中的“彭彭”,总是以乐观、积极的心态对待周边的事物。本人的技术路线从Java全栈工程师一路奔向大数据开发、数据挖掘领域,如今终有小成,愿将昔日所获与大家交流一二,希望对学习路上的你有所助益。...转载 2021-01-19 14:20:00 · 520 阅读 · 0 评论