
本文深入探讨Go并发编程中常见的“all goroutines are asleep – deadlock!”错误,尤其是在构建工作者系统时因未正确关闭输出通道导致的死锁。通过分析问题根源,文章将演示如何利用控制通道或sync.WaitGroup机制,实现对工作协程的有效协调,确保所有任务完成后安全关闭通道,从而优雅地终止程序,避免死锁。
引言:Go 并发中的死锁现象
在Go语言的并发编程模型中,goroutine和channel是核心构建块。然而,不当的通道使用方式,特别是通道的关闭机制,很容易导致程序进入“死锁”状态,并抛出fatal error: all goroutines are asleep – deadlock!。这个错误表明Go运行时检测到程序中所有goroutine都处于阻塞状态,且没有可以被调度的goroutine来解除这些阻塞,因此程序无法继续执行。
在一个典型的生产者-消费者或工作者池(Worker Pool)模式中,如果一个或多个goroutine正在尝试从一个通道接收数据,而这个通道的发送方已经完成其所有工作,但却忘记关闭通道,那么这些接收goroutine将永远等待下去,从而导致整个程序死锁。
案例分析:工作者系统中的死锁
考虑一个Go语言实现的工作者系统骨架,其设计目标是创建一批工作协程处理任务,并通过通道进行协调。
原始代码结构如下:
package mainimport ( "bufio" "flag" "fmt" "log" "math/rand" "os" "time")type Work struct { id int ts time.Duration}const ( NumWorkers = 5000 NumJobs = 100000)func worker(in <-chan *Work, out chan<- *Work) { for w := range in { st := time.Now() time.Sleep(time.Duration(rand.Int63n(int64(200 * time.Millisecond)))) w.ts = time.Since(st) out <- w }}func main() { wait := flag.Bool("w", false, "wait for before starting") flag.Parse() if *wait { fmt.Printf("I'm , press to continue", os.Getpid()) reader := bufio.NewReader(os.Stdin) reader.ReadString('n') } Run()}func Run() { in, out := make(chan *Work, 100), make(chan *Work, 100) for i := 0; i < NumWorkers; i++ { go worker(in, out) } go createJobs(in) receiveResults(out)}func createJobs(queue chan<- *Work) { for i := 0; i < NumJobs; i++ { work := &Work{i, 0} queue <- work } close(queue) // 输入通道在所有任务创建后关闭}func receiveResults(completed <-chan *Work) { for w := range completed { // 从完成通道接收结果 log.Printf("job %d completed in %s", w.id, w.ts) }}
在这个示例中,createJobs协程负责向in通道发送任务,并在所有任务发送完毕后正确地关闭了in通道。worker协程从in通道接收任务,处理后将结果发送到out通道。receiveResults函数则通过for w := range completed循环从out通道(在此函数中命名为completed)接收所有完成的任务结果。
死锁的根源在于:当createJobs协程完成并关闭in通道后,所有的worker协程会逐一处理完in通道中剩余的任务,然后它们从for w := range in循环中退出。这些worker协程退出后,out通道将不再有发送者。然而,receiveResults函数中的for w := range completed循环会持续尝试从out通道接收数据。由于out通道从未被关闭,receiveResults协程将永远阻塞等待新的数据。此时,所有worker协程已退出,createJobs协程也已完成,只剩下receiveResults协程一个活跃的goroutine在无限等待一个永远不会关闭的通道,最终导致死锁。
解决方案一:使用控制通道进行协调
为了解决这个问题,我们需要在所有工作协程完成其工作后,显式地关闭out通道。一种方法是引入一个额外的“控制通道”来协调工作协程的完成状态。
Word-As-Image for Semantic Typography
文字变形艺术字、文字变形象形字
62 查看详情
实现步骤:
修改 worker 函数: 在每个worker协程完成其所有任务并从in通道的range循环退出后,向一个专门的控制通道发送一个信号,表明它已完成工作。引入 control 协程: 创建一个独立的goroutine,负责监听控制通道。它会等待接收所有worker协程发出的完成信号。一旦所有信号都收到,就意味着所有worker都已完成,此时可以安全地关闭out通道。
package mainimport ( "bufio" "flag" "fmt" "log" "math/rand" "os" "time")type Work struct { id int ts time.Duration}const ( NumWorkers = 5000 NumJobs = 100000)// worker 函数现在接收一个额外的控制通道参数func worker(ctrl chan<- bool, in <-chan *Work, out chan<- *Work) { defer func() { ctrl <- true // worker 完成其所有工作后,向控制通道发送完成信号 }() for w := range in { st := time.Now() time.Sleep(time.Duration(rand.Int63n(int64(200 * time.Millisecond)))) w.ts = time.Since(st) out <- w }}// control 协程负责等待所有worker完成,然后关闭输出通道func control(ctrl <-chan bool, numWorkers int, out chan<- *Work) { for i := 0; i < numWorkers; i++ { <-ctrl // 等待每个worker的完成信号 } close(out) // 所有worker完成后,关闭输出通道}func main() { wait := flag.Bool("w", false, "wait for before starting") flag.Parse() if *wait { fmt.Printf("I'm , press to continue", os.Getpid()) reader := bufio.NewReader(os.Stdin) reader.ReadString('n') } Run()}func Run() { in, out := make(chan *Work, 100), make(chan *Work, 100) ctrl := make(chan bool, NumWorkers) // 创建控制通道,缓冲大小为worker数量 // 启动工作协程 for i := 0; i < NumWorkers; i++ { go worker(ctrl, in, out) } // 启动任务创建协程 go createJobs(in) // 启动控制协程,它将等待所有worker完成并关闭 'out' 通道 go control(ctrl, NumWorkers, out) // 接收结果 receiveResults(out)}func createJobs(queue chan<- *Work) { for i := 0; i < NumJobs; i++ { work := &Work{i, 0} queue <- work } close(queue) // 创建任务完成后关闭输入通道}func receiveResults(completed <-chan *Work) { for w := range completed { log.Printf("job %d completed in %s", w.id, w.ts) }}
解决方案二:使用 sync.WaitGroup 进行协调
sync.WaitGroup 是Go标准库提供的一种更通用的同步原语,用于等待一组goroutine完成。它通常比手动管理控制通道更简洁和惯用。
实现步骤:
初始化 sync.WaitGroup: 在主函数或Run函数中声明并初始化一个WaitGroup实例。增加计数: 每当启动一个worker协程时,调用wg.Add(1)来增加计数器。减少计数: 在每个worker协程即将退出时,调用wg.Done()来减少计数器。通常使用defer wg.Done()确保即使协程发生panic也能减少计数。等待完成并关闭通道: 启动一个独立的goroutine,在该协程中调用wg.Wait()。这个调用会阻塞直到WaitGroup的计数器归零(即所有worker都已完成)。wg.Wait()返回后,就可以安全地关闭out通道。
package mainimport ( "bufio" "flag" "fmt" "log" "math/rand" "os" "sync" // 引入 sync 包 "time")type Work struct { id int ts time.Duration}const ( NumWorkers = 5000 NumJobs = 100000)// worker 函数现在接收一个 WaitGroup 指针func worker(wg *sync.WaitGroup, in <-chan *Work, out chan<- *Work) { defer wg.Done() // 确保worker退出时通知WaitGroup for w := range in { st := time.Now() time.Sleep(time.Duration(rand.Int63n(int64(200 * time.Millisecond)))) w.ts = time.Since(st) out <- w }}func main() { wait := flag.Bool("w", false, "wait for before starting") flag.Parse() if *wait { fmt.Printf("I'm , press to continue", os.Getpid()) reader := bufio.NewReader(os.Stdin) reader.ReadString('n') } Run()}func Run() { in, out := make(chan *Work, 100), make(chan *Work, 100) var wg sync.WaitGroup // 声明 WaitGroup // 启动工作协程 for i := 0; i < NumWorkers; i++ { wg.Add(1) // 增加计数 go worker(&wg, in, out) } // 启动任务创建协程 go createJobs(in) // 启动一个独立的协程来等待所有worker完成并关闭输出通道 go func() { wg.Wait() // 等待所有worker完成 close(out) // 关闭输出通道 }() // 接收结果 receiveResults(out)}func createJobs(queue chan<- *Work) { for i := 0; i < NumJobs; i++ { work := &Work{i, 0} queue <- work } close(queue) // 创建任务完成后关闭输入通道}func receiveResults(completed <-chan *Work) { for w := range completed { log.Printf("job %d completed in %s", w.id, w.ts) }}
通道管理的关键原则
正确管理Go通道是编写健壮并发程序的基石。以下是一些关键原则:
谁负责关闭通道? 通常情况下,通道的发送方应该负责关闭通道。如果存在多个发送方,则需要一个协调机制(如sync.WaitGroup或一个单独的协调goroutine)来确保所有发送操作都已完成,并且没有新的发送操作会发生,然后由这个协调者关闭通道。何时关闭通道? 只有当确定不会再有任何数据发送到通道时,才应该关闭它。过早关闭通道可能导致向已关闭通道发送数据,引发panic。避免向已关闭的通道发送数据: 尝试向一个已关闭的通道发送数据会导致运行时panic。从已关闭的通道接收数据: 从已关闭的通道接收数据是安全的。for range循环会在通道关闭且所有已发送数据被取出后自动退出。非range接收操作(val, ok := <-ch)会立即返回通道元素的零值,并且ok为false,表示通道已关闭。接收方不应关闭通道: 通常不建议由通道的接收方来关闭通道,因为接收方无法确定是否有其他goroutine仍在向该通道发送数据。如果接收方关闭了通道,而发送方仍然尝试发送数据,就会导致panic。
总结
“all goroutines are asleep – deadlock!”错误是Go并发编程中常见的陷阱,通常源于通道的生命周期管理不当,特别是输出通道未被正确关闭。通过本文介绍的两种方法——使用控制通道或sync.WaitGroup——我们可以有效地协调goroutine的完成状态,确保在所有发送方都已完成工作后,能够及时关闭通道,从而避免死锁,并使程序优雅地退出。
在实际开发中,sync.WaitGroup因其简洁性和通用性,常被视为处理此类同步问题的首选方案。理解并遵循通道管理的
以上就是Go 并发编程:避免 Goroutine 死锁与通道的优雅关闭的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/970624.html
微信扫一扫
支付宝扫一扫