KaiwuDB delete语句delete from table where xxx的执行流程为:

delete主要分为两个部分,一个部分为scan过程,拉取表中的数据,第二部分,根据过滤条件,调用b.Del()函数删除对应的数据。相关逻辑计划对象图为:

deleteNode下包含一个scanNode,负责拉取表中数据,deleteRun包括实际执行delete操作的信息,包括表中数据的索引信息,事务相关信息txn,batch…,还有tabledesc等等信息。
其中在构建逻辑计划时,有一个maybeCreateDeleteFastNode函数,来判断是否可以执行deleterange操作,判断条件为:
1.表中是否具有索引,如果有,不可以执行deleterange
2.该表是否为交错表,如果是,不可以执行deleterange
3.该表主键是否关联了其他表的外键,如果是,不可以执行deleterange
4.renderNode下是否为scanNode,如果不是,不可以执行deleterange
5.过滤条件没有被下推为span,不可以执行deleterange
6.有limit关键字时,不可以执行deleterange
在满足以上过滤条件后,如果可以执行deleterange,就会把其中的deleteNode转化为deleteRangeNode,在执行时,rowCountNode的startExec会直接调用到deleteRangeNode的startExec,通过直接下发对span的DelRange操作来删除数据,不会调用到BatchNext中。
deleteRange过程部分代码:
spans := make([]roachpb.Span, len(d.spans))
copy(spans, d.spans)
for len(spans) != 0 {
b := params.p.txn.NewBatch()
for _, span := range spans {
if traceKV {
log.VEventf(ctx, 2, "DelRange %s - %s", span.Key, span.EndKey)
}
b.DelRange(span.Key, span.EndKey, true /* returnKeys */)
}
b.Header.MaxSpanRequestKeys = TableTruncateChunkSize
if err := params.p.txn.Run(ctx, b); err != nil {
return err
}
spans = spans[:0]
for _, r := range b.Results {
var prev []byte
for _, keyBytes := range r.Keys {
// If prefix is same, don't bother decoding key.
if len(prev) > 0 && bytes.HasPrefix(keyBytes, prev) {
continue
}
after, ok, err := d.fetcher.ReadIndexKey(keyBytes)
if err != nil {
return err
}
if !ok {
return pgerror.NewAssertionErrorf("key did not match descriptor")
}
k := keyBytes[:len(keyBytes)-len(after)]
if !bytes.Equal(k, prev) {
prev = k
d.rowCount++
}
}
if r.ResumeSpan != nil && r.ResumeSpan.Valid() {
spans = append(spans, *r.ResumeSpan)
}
}
}
本文详细介绍了KaiwuDB中DELETE语句的执行过程,包括扫描表数据和根据过滤条件删除数据的两个主要步骤。在构建逻辑计划时,通过maybeCreateDeleteFastNode函数判断是否能执行deleterange操作,考虑了表索引、交错表、外键关联等因素。当满足特定条件时,执行deleterange操作,通过直接下发DelRange操作提高删除效率。文中还展示了deleteRange过程的关键代码片段,展示如何批量删除数据并处理残留的span。
191

被折叠的 条评论
为什么被折叠?



