嗨,大家好,我是小萝卜算子。(微信公众号:数据仓库践行者。感谢关注)
目前正在带领小伙伴们阅读spark源码,有兴趣的小伙伴可以私信我,获取大数据进阶的相关视频哦。
今天在问答区碰到了一个有趣的问题。
1.表结构
CREATE TABLE `customer`(
`id` int COMMENT '用户主键',
`name` string COMMENT '姓名'
`contact` string COMMENT '联系人')
2.有趣的事情来了
然后写了一个非常有趣的sql
SELECT
c1.id,c1.`name`,
c1.contact
from
customers as c1,
customers as c2
WHERE
c1.name=c2.name and
c2.contact='Jim'
然后疑问就来了,这个又必要这么写吗。这不是重复了吗?有必要这么写吗
有经常阅读我的博客的小伙伴,应该 感觉 这个博客和以前的有点不一样,emm…
是不是发现没有往表里插入数据。那现在 我们加一些数据
3.加点数据
id name contact
--------------------------------
1 zhangsan Jim
2 lisi Tony
3 wangwu Jim
4 lurenjia John
5 zhangsan Bob
最终结果
现在 我把 最开始有疑问的sql 查询结果给展示一下
哈哈哈哈,是不是和想象中的不太一样。
这才应该是你想到的结果吧
那么为什么两个结果不一样呢?
其实把刚才的sql变化一下你就懂了
要是还不懂的话呢,再给你变化一下
emmm… 这是怎么回事,为什么是25条数据???
因为5*5=25啊
如果要是表里有6条数据,那么这个结果就会是 6*6=36了呢
要是还是不懂得话呢,那就在变化一下
要是这样你还不懂的话,emmm… 那我只能告诉你
从这个结果上继续添加条件,就会看到最开始题目的效果哦