- 现代数据的4V特征
- 数据规模海量(Volume);
- 数据流转快速(Velocity);
- 数据类型多样(Variety);
- 数据价值巨大(Value)。
- 简述数据的五大类型,针对每种类型的数据举1~2个例子
- web和社交媒体数据 例:cookie缓存web页面的信息,自动登录
- 机器对机器的数据 例:RFID射频识别技术,基站,GPS
- 大体量交易数据 例:大数据分布式
- 生物计量学数据 例:人脸识别
- 人工生成的数据 例:试卷批改、识题、机器答题,通过语音识别纠正和改善发音
- 简述数据治理主要涉及哪些方面(原则)
- 组织的治理;
- 元数据的管理;
- 数据隐私的治理;
- 数据质量的治理;
- 业务流程整合;
- 主数据整合;
- 数据生命周期管理。
- 针对培训机构项目,看了几个同学的解决方案后,你觉得从数据治理的角度,还存在什么问题,或者接下来应该从哪些角度对该项目进行优化(功能增强、增加、调整)?
存在的问题和优化方式:
- 对数据类型的定义不准确。比如:金额要设置,小数点保留两位;
- 元数据的设置有问题。比如:设置ID的时候需要自动生成,不能自己编写,不然太麻烦;
- 有些选项必须设置为必填项。比如:姓名;
- 在有些选项中需要设置默认值;
- 注意公式的编辑。比如离职日期:IF(是否正式员工=="在职","NULL",NOW()+30);
- 理清各表单中的关联数据,尽量全面考虑。