①列的裁剪,查询时只写我们需要的字段,提高效率
②两张表关联时,可以把数据量小的表写在前面,大表写在后面,这样在加载时会把小表加载到内存中,减少资源占用。
③多采用子查询,查出需要的数据,再与其他表关联
④写对表的过滤条件时,最好在map阶段就对表进行过滤,不要再reduce阶段过滤
博客介绍了SQL查询优化的技巧,包括列裁剪,查询时只选所需字段;表关联时,小表在前大表在后以减少资源占用;多采用子查询,先查出所需数据再关联;写过滤条件时,最好在map阶段对表进行过滤。
①列的裁剪,查询时只写我们需要的字段,提高效率
②两张表关联时,可以把数据量小的表写在前面,大表写在后面,这样在加载时会把小表加载到内存中,减少资源占用。
③多采用子查询,查出需要的数据,再与其他表关联
④写对表的过滤条件时,最好在map阶段就对表进行过滤,不要再reduce阶段过滤

被折叠的 条评论
为什么被折叠?