云原生监控的未来

下图Peter Bourgon在 2017 Distributed Tracing Summit后发表的一篇博文，简洁扼要地介绍了Metrics、Tracing、Logging三者的定义和关系。这三种数据在可观察性中都有各自的发挥空间，每种数据都没办法完全被其他数据代替。

Tracing：提供了一个请求从接收到处理完毕整个生命周期的跟踪路径，通常请求都是在分布式的系统中处理，所以也叫做分布式链路追踪。
Metrics：提供量化的系统内/外部各个维度的指标，一般包括Counter、Gauge、Histogram等。
Logging：提供系统/进程最精细化的信息，例如某个关键变量、事件、访问记录等。

OpenTelemetry的终态就是实现Metrics、Tracing、Logging的融合，作为CNCF可观察性的终极解决方案。

这三者在可观察性上缺一不可：基于Metrics的告警发现异常，通过Tracing定位问题（可疑）模块，根据模块具体的日志详情定位到错误根源，最后再基于这次问题调查经验调整Metrics（增加或者调整报警阈值等）以便下次可以更早发现/预防此类问题。

常规的故障定位如下所示，先是收到告警，然后查看监控大屏，发现某些指标异常，查看对应的日志，最后查看调用链，最终解决问题。

整个链路非常冗长，需要童鞋们登录到多个平台，综合各种信息才能解决问题。为此OpenTelemetry 这个项目的目标就是将这三种监控数据关联整合到一起。

这里的核心就是这个 OpenTelemetry collector，它能够将多种指标进行关联，比如我们可以将日志和监控都打上相同的标签label，然后通过label 去关联查询。不过OpenTelemetry目前还处于发展的初期。目前Promethues、Loki等项目已经积极参与，未来还会有更多的项目支持OpenTelemetry。

展开阅读全文

页面更新：2024-05-15

标签：阈值维度冗长分布式下图可疑模块异常指标未来发现项目数据系统科技日志信息

1 2 3 4 5

云原生监控的未来

Java 集合概览

KVM : 开启 virsh console 连接

rust从入门到放弃（四）：trait

k8s朋友圈（四）Harbor

k8s朋友圈（三）CoreDNS

k8s朋友圈（五）Dragonfly

k8s朋友圈（二）之promethues架构分析

k8s朋友圈（一）云原生概览

Linux 路由新玩法，策略路由

如何将linux 做成一台路由器

Centos8 如何配置VNC服务

Rust从入门到放弃（一）：数据类型

rust 从入门到放弃（三）：函数

Go sync 并发包Demo详解

Rust从入门到放弃（二）：表达式

Rust从入门到放弃（一）：数据类型

老家的老房子，是挥不去的心事，还有多维度的价值

看奥运直播时，发现自己比冠军还厉害，有机会参加比赛吗

阿里黑科技再现！什么是AI细粒度图像识别技术

AR技术为生活创新并继续构建可穿戴计算领域的未来

芯片供应商台积电市值超越科技巨头腾讯/阿里巴巴,一并

英伟达第二季度收入增长 68% 得益于游戏和数据中心业

纳指创下新的收盘纪录，因为多头在 8 月的最后几天买入

Bodo.ai 筹集 1400 万美元，旨在让 Python 更好地处理大

如果获得批准，西部数据与铠侠合并将撼动全球芯片产业