看完这篇文章,你就明白运维监控体系了

来自:知乎,作者:聆听幸福

链接:https://zhuanlan.zhihu.com/p/342809838

总结归纳运维工作中的监控内容。

监控目标

明白监控的重要性以及使用监控要实现的业务目标

通常包括以下三点:

监控方法

看完这篇文章,你就明白运维监控体系了

监控核心

监控工具

监控流程

通过SNMP、Agent、ICMP、SSH、IPMI等对系统进行数据采集

各类数据库服务,MySQL、PostgreSQL

提供图形及时间线情况信息,方便我们定位故障所在

指标信息、指标趋势展示

电话、邮件、微信、短信、报警升级机制

故障级别判定,找响应人员进行快速处理

监控指标

硬件监控

系统监控

应用监控

MySQL

Redis、Redis Cluster

Nginx

网络监控

流量分析

日志监控

安全监控

性能监控(APM)java|php|go|nodejs|分布式链路追踪

业务监控

电商业务为例:

其他

监控报警

报警处理

故障自愈: 服务器宕机自动启动。利用软件机制supervisor,systemd或者自定义脚本实现

综合监控

硬件监控

通过SNMP来进行路由器交换机的监控、其他内容使用IPMI实现。如果都是公有云,可以忽略这部分内容。案例:Open-Falcon监控H3C-ER3260G2路由器

系统监控

服务监控

监控总结

完整的监控系统,需要对业务有详尽的了解,软件只是手段。

展开阅读全文

页面更新:2024-06-10

标签:使用率   负载   磁盘   流量   故障   状态   指标   体系   目标   硬件   业务   工具   用户   系统   科技   软件   信息

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top