Golang Mutex实现互斥的具体方法

Golang
323
0
0
2023-05-14
目录
  • 获取锁
  • 未锁——直接获取
  • 在不饥饿且旋的不多的情况下,尝试自旋
  • 自旋究竟在做什么呢?
  • 计算期望状态
  • 尝试达成获取锁期望
  • 考虑几种场景
  • 释放锁
  • 只有已锁——直接释放
  • 慢释放

Mutex是Golang常见的并发原语,不仅在开发过程中经常使用到,如channel这种具有golang特色的并发结构也依托于Mutex从而实现

type Mutex struct {
  // 互斥锁的状态,比如是否被锁定
  state int32
  // 表示信号量。堵塞的协程会等待该信号量,解锁的协程会释放该信号量
  sema int32
}
const (
  // 当前是否已经上锁
  mutexLocked = 1 << iota // 1
  // 当前是否有唤醒的goroutine
  mutexWoken // 2
  // 当前是否为饥饿状态
  mutexStarving // 4
  // state >> mutexWaiterShift 得到等待者数量
  mutexWaiterShift = iota // 3

  starvationThresholdNs = 1e6 // 判断是否要进入饥饿状态的阈值
)

Mutex有正常饥饿模式。

  • 正常模式:等待者会入队,但一个唤醒的等待者不能持有锁,以及与新到来的goroutine进行竞争。新来的goroutine有一个优势——他们已经运行在CPU上。
  • 超过1ms没有获取到锁,就会进入饥饿模式
  • 饥饿模式:锁的所有权直接移交给队列头goroutine,新来的goroutine不会尝试获取互斥锁,即使互斥锁看起来已经解锁,也不会尝试旋转。相反,他们自己排在等待队列的末尾。

若等待者是最后一个,或者等待小于1ms就会切换回正常模式

获取锁

未锁——直接获取

func (m *Mutex) Lock() {
    // 快路径。直接获取未锁的mutex
  // 初始状态为0,所以只要状态存在其他任何状态位都是无法直接获取的
    if atomic.CompareAndSwapInt32(&m.state, 0, mutexLocked) {
        if race.Enabled {
            race.Acquire(unsafe.Pointer(m))
        }
        return
    }
    // Slow path (outlined so that the fast path can be inlined)
    m.lockSlow()
}

在不饥饿且旋的不多的情况下,尝试自旋

        // 只要原状态已锁且不处于饥饿状态,并满足自旋条件
        if old&(mutexLocked|mutexStarving) == mutexLocked && runtime_canSpin(iter) {
            // 在当前goroutine没有唤醒,且没有其他goroutine在尝试唤醒,且存在等待的情况下,cas标记存在goroutine正在尝试唤醒。若标记成功就设置当前goroutine已经唤醒了
            if !awoke && old&mutexWoken == 0 && old>>mutexWaiterShift != 0 &&
                atomic.CompareAndSwapInt32(&m.state, old, old|mutexWoken) {
                awoke = true
            }
      // 自旋
            runtime_doSpin()
      // 自旋次数加一
            iter++
      // 更新原状态
            old = m.state
            continue
        }

具体的自旋条件如下

  • 自旋次数小于4
  • 多核CPU
  • p数量大于1
  • 至少存在一个p的队列为空
const (
    locked uintptr = 1

    active_spin     = 4
    active_spin_cnt = 30
    passive_spin    = 1
)

func sync_runtime_canSpin(i int) bool {
    // sync.Mutex is cooperative, so we are conservative with spinning.
    // Spin only few times and only if running on a multicore machine and
    // GOMAXPROCS>1 and there is at least one other running P and local runq is empty.
    // As opposed to runtime mutex we don't do passive spinning here,
    // because there can be work on global runq or on other Ps.
    if i >= active_spin || ncpu <= 1 || gomaxprocs <= int32(sched.npidle+sched.nmspinning)+1 {
        return false
    }
    if p := getg().m.p.ptr(); !runqempty(p) {
        return false
    }
    return true
}

自旋究竟在做什么呢?

自旋是由方法runtime_doSpin()执行的,实际调用了procyield()

# 定义了一个runtime.procyield的文本段,通过NOSPLIT不使用栈分裂,$0-0 表示该函数不需要任何输入参数和返回值
TEXT runtime·procyield(SB),NOSPLIT,$0-0
    # 从栈帧中读取cycles参赛值,并储存在寄存器R0中
    MOVWU    cycles+0(FP), R0
# 组成无限循环。在每次循环中,通过YIELD告诉CPU将当前线程置于休眠状态
# YIELD: x86上,实现为PAUSE指令,会暂停处理器执行,切换CPU到低功耗模式并等待更多数据到达。通常用于忙等待机制,避免无谓CPU占用
# ARM上,实现为WFE(Wait For Event),用于等待中断或者其他事件发生。在某些情况下可能会导致CPU陷入死循环,因此需要特殊处理逻辑解决
again:
    YIELD
    # 将R0值减1
    SUBW    $1, R0
    # CBNZ(Compare and Branch on Non-Zero)检查剩余的时钟周期数是否为0。不为0就跳转到标签again并再次调用YIELD,否则就退出函数
    CBNZ    R0, again
    RET

以上汇编代码分析过程感谢chatgpt的大力支持

从代码中可以看到自旋次数是30次

const active_spin_cnt = 30

func sync_runtime_doSpin() {
    procyield(active_spin_cnt)
}

计算期望状态

1.原状态不处于饥饿状态,新状态设置已锁状态位

原状态处于已锁状态或饥饿模式,新状态设置等待数量递增

当前goroutine是最新获取锁的goroutine,在正常模式下期望就是要获取锁,那么就应该设置新状态已锁状态位

如果锁已经被抢占了,或者处于饥饿模式,那么就应该去排队

2.若之前尝试获取时已经超过饥饿阈值时间,且原状态已锁,那么新状态设置饥饿状态位

3.若goroutine处于唤醒,则新状态清除正在唤醒状态位

期望是已经获取到锁了,那么自然要清除正在获取的状态位
        new := old
        // Don't try to acquire starving mutex, new arriving goroutines must queue.
    // 若原状态不处于饥饿状态,就给新状态设置已加锁
        if old&mutexStarving == 0 {
            new |= mutexLocked
        }
    // 只要原状态处于已锁或者饥饿模式,就将新状态等待数量递增
        if old&(mutexLocked|mutexStarving) != 0 {
            new += 1 << mutexWaiterShift
        }
    // 若已经等待超过饥饿阈值时间且原状态已锁,就设置新状态为饥饿
    // 这也意味着如果已经不处于已锁状态,就可以切换回正常模式了
        if starving && old&mutexLocked != 0 {
            new |= mutexStarving
        }
    // 如果已经唤醒了(也就是没有其他正在抢占的goroutine),则在新状态中清除正在唤醒状态位
        if awoke {
            // The goroutine has been woken from sleep,
            // so we need to reset the flag in either case.
            if new&mutexWoken == 0 {
                throw("sync: inconsistent mutex state")
            }
            new &^= mutexWoken
        }

尝试达成获取锁期望

cas尝试从原状态更新为新的期望状态

如果失败,则更新最新状态,继续尝试获取锁

说明这期间锁已经被抢占了

若原来既没有被锁住,也没有处于饥饿模式,那么就获取到锁,直接返回

排队。若之前已经在等待了就排到队列头

获取信号量。此处会堵塞等待

被唤醒,认定已经持有锁。并做以下饥饿相关处理

  • 计算等待时长,若超出饥饿阈值时间,就标记当前goroutine处于饥饿
  • 若锁处于饥饿模式,递减等待数量,并且在只有一个等待的时候,切换锁回正常模式
if atomic.CompareAndSwapInt32(&m.state, old, new) {
      // 如果原状态既没有处于已锁状态,也没有处于饥饿模式
      // 那么就表示已经获取到锁,直接退出
            if old&(mutexLocked|mutexStarving) == 0 {
                break // locked the mutex with CAS
            }
      // 若已经在等待了,就排到队列头
            queueLifo := waitStartTime != 0
            if waitStartTime == 0 {
                waitStartTime = runtime_nanotime()
            }
      // 尝试获取信号量。此处获取一个信号量以实现互斥
      // 此处会进行堵塞
            runtime_SemacquireMutex(&m.sema, queueLifo, 1)
      // 被信号量唤醒之后,发现若等待时间超过饥饿阈值,就切换到饥饿模式
            starving = starving || runtime_nanotime()-waitStartTime > starvationThresholdNs
            old = m.state
      // 处于饥饿模式下
            if old&mutexStarving != 0 {
                // If this goroutine was woken and mutex is in starvation mode,
                // ownership was handed off to us but mutex is in somewhat
                // inconsistent state: mutexLocked is not set and we are still
                // accounted as waiter. Fix that.
        // 若既没有已锁且正在尝试唤醒,或者等待队列为空,就代表产生了不一致的状态
                if old&(mutexLocked|mutexWoken) != 0 || old>>mutexWaiterShift == 0 {
                    throw("sync: inconsistent mutex state")
                }
        // 当前goroutine已经获取锁,等待队列减1;若等待者就一个,就切换正常模式。退出
                delta := int32(mutexLocked - 1<<mutexWaiterShift)
                if !starving || old>>mutexWaiterShift == 1 {
                    delta -= mutexStarving
                }
                atomic.AddInt32(&m.state, delta)
                break
            }
      // 不处于饥饿模式下,设置当前goroutine为唤醒状态,重置自璇次数,继续尝试获取锁
            awoke = true
            iter = 0
        } else {
      // 若锁被其他goroutine占用了,就更新原状态,继续尝试获取锁
            old = m.state
        }

考虑几种场景

  • 如果lock当前只有一个goroutine g1去获取锁,那么会直接快路径,cas更新已锁状态位,获取到锁
  • 如果锁已经被g1持有,
  • 此时g2会先自旋4次,
  • 然后计算期望状态为已锁、等待数量为1、唤醒状态位被清除
  • 在cas更新的时候尝试更新锁状态成功,接着因为原状态本身处于已锁,所以就不能获取到锁,只能排队,信号量堵塞
  • g1释放锁后,g2被唤醒,接着再次计算期望状态,并cas更新状态成功,直接获取到锁
  • 如果锁已经被g1持有,且g2在第一次尝试获取时超过了1ms(也就是饥饿阈值),那么
  • 计算期望状态为已锁、饥饿、清除唤醒状态位
  • cas更新状态成功,排在队列头,并被信号量堵塞
  • g1释放锁后,g2被唤醒就直接获取到锁,并减去排队数量以及清空饥饿位

释放锁

只有已锁——直接释放

如果没有排队的goroutine,没有处于饥饿状态,也没有真正尝试获取锁的goroutine,那么就可以直接cas更新状态为0

func (m *Mutex) Unlock() {
    // Fast path: drop lock bit.
    new := atomic.AddInt32(&m.state, -mutexLocked)
    if new != 0 {
        // Outlined slow path to allow inlining the fast path.
        // To hide unlockSlow during tracing we skip one extra frame when tracing GoUnblock.
        m.unlockSlow(new)
    }
}

慢释放

  • 如果原锁没有被锁住,就报错
  • 若原状态不处于饥饿状态,尝试唤醒等待者
  • 若现在锁已经被获取、正在获取、饥饿或者没有等待者,直接返回
  • 期望状态等待数量减1,并设置正在唤醒状态位
  • cas尝试更新期望状态,若成功,释放
  • 失败说明在这过程中又有goroutine在尝试获取,那么继续下一轮释放
  • 处于饥饿状态,直接释放信号量,移交锁所有权
func (m *Mutex) unlockSlow(new int32) {
  // 若原状态根本没有已锁状态位
    if (new+mutexLocked)&mutexLocked == 0 {
        throw("sync: unlock of unlocked mutex")
    }
  // 若原状态不处于饥饿状态
    if new&mutexStarving == 0 {
        old := new
        for {
      // 若没有等待,或者存在goroutine已经被唤醒,或者已经被锁住了,就不需要唤醒任何人,返回
            if old>>mutexWaiterShift == 0 || old&(mutexLocked|mutexWoken|mutexStarving) != 0 {
                return
            }
            // Grab the right to wake someone.
      // 设置期望状态为正在获取状态位,并减去一个等待者
            new = (old - 1<<mutexWaiterShift) | mutexWoken
      // 尝试cas更新为期望新状态,若成功就释放信号量,失败就更新原状态,进行下一轮释放
      // 失败说明在这过程中又有goroutine在尝试获取,比如已经获取到了、变成饥饿了、自旋等
            if atomic.CompareAndSwapInt32(&m.state, old, new) {
                runtime_Semrelease(&m.sema, false, 1)
                return
            }
            old = m.state
        }
    } else {
    // 饥饿模式下就移交锁所有权给下一个等待者,并放弃时间片,以便该等待者可以快速开始
        runtime_Semrelease(&m.sema, true, 1)
    }
}