这是从优快云看到的金山面试题
问题:数据库1中存放着a类数据,数据库2中存放着以天为单位划分的表30张(比如table_20110909,table_20110910,table_20110911),总共是一个月的数据。表1中的a类数据中有一个字段userid来唯一判别用户身份,表2中的30张表(每张表结构相同)也有一个字段userid来唯一识别用户身份。如何判定a类数据库的多少用户在数据库2中出现过?
解决方案:
这种情况一般的处理方法是新建一张user表,写一个作业在每天凌晨将前一天产生的数据插入到这张表中。然后将需要对比的表和user表进行对比
1.建表table_1,存放a类数据,并插入几条记录


2.模拟建两张表,代表每天产生的数据库表


3.将这两张表中的数据插入到user表中

4.对两张表中的数据进行对比

3条数据相同
本文介绍了一种通过创建用户表并在每日凌晨更新前一日数据的方法,来解决如何判断两个数据库中用户的交集问题。具体步骤包括建立模拟表并进行数据比对。

1438

被折叠的 条评论
为什么被折叠?



