
数据仓库
文章平均质量分 72
iteye_13339
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
ETL过程的数据测试
1.记录数对比在两种情况下必须要做如此的验证:a. 数据迁移这个场景主要是DW环境从一种迁移到另一种,比如RAC迁到HIVE之类的,记录数对比是首要的,迁移的数据量都不对,具体的数据内容对不对就不用考虑了。b. ETL转换这种场景是更常见的,毕竟数据研发,ETL过程是必不可少的。那么,记录数对比主要涉及如下几类:1). 从操...原创 2012-04-15 17:47:16 · 760 阅读 · 0 评论 -
何为大数据
1.数据规模这个是最基本的要求,数据规模不到一定级别,你就不好意思说你是大数据。但数据规模多大才算大,我给不出来一个通用的数字去界定大数据。虽然很多公司的数据量都会上P,但这个不能作为大数据的标准。自我感觉,能称自己公司已经进入大数据时代,这个公司就需要考虑如下几点去应对自己的数据:1.独立的离线历史数据存储;2.数据保密管理策略;3.数据仓库+数据分析;4.成熟的基于数据的商业模式或...2012-05-19 22:36:53 · 129 阅读 · 0 评论