因为spark没有直接的update操作 所以我这里采用md5 进行和前一天的数据对比 有变化的更新进去
只是说个思路哈
具体的实现可以搜下md5使用
本文探讨了在Spark中采用MD5对比进行数据更新的方法,通过比较前后两天数据的MD5值来判断是否需要更新,这是一种有效的数据同步策略。
因为spark没有直接的update操作 所以我这里采用md5 进行和前一天的数据对比 有变化的更新进去
只是说个思路哈
具体的实现可以搜下md5使用
5270

被折叠的 条评论
为什么被折叠?