Promethues升级死锁

promethues升级的时候报错：“opening storage failed: lock DB directory: resource temporarily unavailable”

从报错看是TSDB 数据库打开失败了。进入prometheus存储TSDB数据的目录/prometheus可以看到：

这个lock 文件如下所示

我们是通过Deployment方式部署promethues的，Deployment默认的滚动策略是先启动一个新的pod，等新的pod启动成功后，再删除老的pod，由于两个prometheus挂载同一块存储，共用同一个lock文件，所以新的pod等待老的pod结束服务(给lock文件解锁)才能给lock文件加锁然后开始提供服务，而kubernetes等待新的pod启动完成开始服务了才能停止并删除老的pod，这样就产生了一个“死锁”。

查看promethues关于加锁的代码如下：

func Flock(fileName string) (r Releaser, existed bool, err error) {
    if err = os.MkdirAll(filepath.Dir(fileName), 0755); err != nil {
        return nil, false, err
    }

    _, err = os.Stat(fileName)
    existed = err == nil

    r, err = newLock(fileName)
    return r, existed, err
}

可以看出该方法中创建了lock文件并且在该文件上调用了newLock()方法，进一步查看newLock()方法：

func newLock(fileName string) (Releaser, error) {
    f, err := os.OpenFile(fileName, os.O_RDWR|os.O_CREATE, 0666)
    if err != nil {
        return nil, err
    }
    l := &unixLock{f}
    err = l.set(true)
    if err != nil {
        f.Close()
        return nil, err
    }
    return l, nil
}

func (l *unixLock) set(lock bool) error {
    how := syscall.LOCK_UN
    if lock {
        how = syscall.LOCK_EX
    }
    return syscall.Flock(int(l.f.Fd()), how|syscall.LOCK_NB)
}

就是通过Flock系统调用对上面的 lock 文件加锁实现多个promethues写数据互斥。

那么解决这个问题就简单了，方式一是直接把老的pod删除，方法二是采用statefulset 部署，statefulset 会先干掉老的pod 然后再启动新Pod。方法三比较hack就是直接将maxSurge设置成0，那么这样也会先杀死老的pod，然后再启动新Pod。

strategy:
    rollingUpdate:
         maxSurge: 0
         maxUnavailable: 1

展开阅读全文

页面更新：2024-03-18

标签：死锁解锁加锁策略两个结束代码简单方式数据库文件目录方法数据系统科技

1 2 3 4 5

Promethues升级死锁

k8s容器开发（二）：构建本地开发环境

深入理解k8s之immutable（不可变）Secrets和ConfigMaps实现

钓鱼和摄影，耗时费力开销大的休闲方式，一些人却主动入坑

地摊经济：流量在哪里，商业机会就在哪里

韭菜代表发个言，给股市支几招，觉得如何？

干饭指数，餐馆、食堂、家，一本正经的六个角度分析，结论是？

贫穷：可以是财富，可以是深坑

购彩票，是很多人的生活方式，与智商税无关

警惕白酒的回光返照，忍住手，半山腰放哨的日子是不好过

头条创作，套路机器人和被机器人套路，一个有意义的猜想

出租车与网约车，身边值得思考的经济学

选购手机，对应需求，性价比才会最高，你想清楚了吗

囚徒困境式的课外补习，叫停的背后逻辑，你想明白了吗

短视频的核心是创意，器材决定的是性价比，0成本，也可以玩

每天早起2小时，一年多出来1个月，意义非凡

钓鱼和摄影，耗时费力开销大的休闲方式，一些人却主动入坑

购彩票，是很多人的生活方式，与智商税无关

芯片供应商台积电市值超越科技巨头腾讯/阿里巴巴,一并

英伟达第二季度收入增长 68% 得益于游戏和数据中心业

普通话干货——必读轻声词的辨别方法

纳指创下新的收盘纪录，因为多头在 8 月的最后几天买入

Bodo.ai 筹集 1400 万美元，旨在让 Python 更好地处理大

如果获得批准，西部数据与铠侠合并将撼动全球芯片产业

英特尔与美国国防部签署协议以支持芯片制造生态系统

标准普尔 500 指数因加税和即将公布的通胀数据而连续