2023.4.10 报表数据导出——DataX&&阅读了解关于业务&&剑指offer
DataX
是一个将异构数据源的同步工具
在项目里,需要最后将ads里的指标同步到MySQL中来,查官网可得知DataX支持hive数据源的读、写,但实质上其实是对hive里存在hdfs上文件的读写。
所以要同步此数据,选择的Reader就是HDFS,Writer就是MySQL Writer
例子:
HDFS----MySQL

\t跟ads的建表语句保持一致,字符分隔符

关于writeMode三种方式的区别:
在是空表的情况下,三种方式写入数据,结果一样;
在往一张表,重复写数据,就有区别了:
1.insert 再往里头写:a)倘若表里没有主键,能写入数据,不会报错,数据重复
2.replace和update需要确保表里有主键,才能工作。
replace into写入数据:底层的插入语句类似,insert into,其写入逻辑是,将已存在的数据删除掉,再写入,实现替换,根据主键替换
update:就是原地修改,用新的字段的各个值去修改表里已存在的数据
结果上insert是一种,replace into 和update是一种,一样的。只是后二者实现手段不一样
业务的概念
参照文章:https://mp.weixin.qq.com/s/e9T6Ubc1gRMlrwrIHaCZcw
业务是 输入特定的资源给出具有商家价值的确定性输出的经营单元
可以回答,你懂的业务究竟是商业模式、业务模型还是具体的执行策略?
(高层的商业模式视角、中层的业务模型视角、基层的执行策略视角)




剑指offer
外链图片转存中…(img-mgAEPIvi-1681151410610)]
剑指offer
06.从尾到头打印链表
文章介绍了使用DataX进行HDFS到MySQL的数据同步,强调了writeMode在不同情况下的行为,特别是insert、replaceinto和update的区别。同时,探讨了业务的概念,将其定义为将资源转化为商业价值的单元,涉及商业模式、业务模型和执行策略的不同层次。此外,提到了《剑指offer》中的链表问题,暗示了面试或编程挑战的场景。
3302

被折叠的 条评论
为什么被折叠?



