golang数据聚合的优雅操作

最新推荐文章于 2024-08-07 23:56:16 发布

huskar-t

最新推荐文章于 2024-08-07 23:56:16 发布

阅读量1.9k

点赞数 1

CC 4.0 BY-SA版权

分类专栏： golang 文章标签： go golang 经验分享缓存算法

本文链接：https://blog.youkuaiyun.com/weixin_44456979/article/details/103631761

golang 专栏收录该内容

5 篇文章

订阅专栏

本文介绍了一种使用Golang进行数据聚合的优雅方法，通过管道和select机制避免了多协程操作中的数据竞争和死锁问题，实现了高效的数据分组和批量处理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

golang数据聚合的优雅操作

场景：

需要将上传的数据进行特性分组之后再进行数据库批量插入或流向下一个处理方法。

痛点：

由于数据不确定性做聚合操作之后会有多组数据需要缓存，如果多协程进行操作需要将缓存数据进行加锁，容易造成数据死锁。

解决：

通过管道和select进行数据传递，同时在select中做缓存的所有操作，在给定条件流向下一个处理方法时通过channel传递过去同时清空对应缓存，
这样操作都在select中不会有竞争发生。

具体方法：

1.创建缓存
2.创建select处理缓存数据流过来的通道
3.在select中缓存数据同时聚合数据，之后判断是否流向下一通道
4.创建worker处理聚合后数据

样例

package main

import (
	"fmt"
	"math/rand"
	"time"
)

type Data struct {
	Id    int
	Value interface{}
}

func main() {
	execCacheCount := 50
	workerCount := 10
	c := make(chan Data)
	stream := make(chan map[int][]Data)
	go func() {
		cache := map[int][]Data{}
		for {
			select {
			case data := <-c:
				cacheData, exist := cache[data.Id]
				if exist {
					cacheData = append(cacheData, data)
				} else {
					cacheData = []Data{data}
				}
				cache[data.Id] = cacheData
				if len(cacheData) >= execCacheCount {
					stream <- cache
					cache = map[int][]Data{}
				}
			}
		}
	}()

	for i := 0; i < workerCount; i++ {
		go func() {
			for {
				select {
				case data := <-stream:
					for key, value := range data {
						fmt.Println("key:", key, "values:", value)
					}
				}
			}
		}()
	}
	for {
		r := rand.New(rand.NewSource(time.Now().UnixNano()))
		data := Data{
			Id:    r.Intn(10),
			Value: r.Intn(20),
		}
		c <- data
		time.Sleep(20 * time.Millisecond)
	}
}