当前位置: 首页 > news >正文

SkyWalking 告警功能

SkyWalking 告警功能是在 6.x 版本新增的,其核心由一组规则驱动,这些规则定义在config/alarm-settings.yml文件中。

告警规则

  • 告警规则:它们定义了应该如何触发度量警报,应该考虑什么条件。
  • Webhook(网络钩子):定义当警告触发时,哪些服务终端需要被告知。

常用告警规则

SkyWalking 的发行版都会默认提供config/alarm-settings.yml文件,里面预先定义了一些常用的告警规则。如下:

  • 过去 3 分钟内服务平均响应时间超过 1 秒。
  • 过去 2 分钟服务成功率低于80%。
  • 过去 3 分钟内服务响应时间超过 1s 的百分比
  • 服务实例在过去 2 分钟内平均响应时间超过 1s,并且实例名称与正则表达式匹配。
  • 过去 2 分钟内端点平均响应时间超过 1 秒。
  • 过去 2 分钟内数据库访问平均响应时间超过 1 秒。
  • 过去 2 分钟内端点关系平均响应时间超过 1 秒。

这些预定义的告警规则,打开config/alarm-settings.yml文件即可看到

告警规则配置项的说明

  • Rule name:规则名称,也是在告警信息中显示的唯一名称。必须以_rule结尾,前缀可自定义
  • Include names:该规则作用于哪些实体名称,比如服务名,终端名(可选,默认为全部)
  • Exclude names:该规则作不用于哪些实体名称,比如服务名,终端名(可选,默认为空)
  • Threshold:阈值
  • OP: 操作符,目前支持 >、
  • Period:多久告警规则需要被核实一下。这是一个时间窗口,与后端部署环境时间相匹配
  • Count:在一个Period窗口中,如果values超过Threshold值(按op),达到Count值,需要发送警报
  • Silence period:在时间N中触发报警后,在TN -> TN + period这个阶段不告警。 默认情况下,它和Period一样,这意味着相同的告警(在同一个Metrics name拥有相同的Id)在同一个Period内只会触发一

http://www.mrgr.cn/news/41248.html

相关文章:

  • LeetCode[中等] 763. 划分字母区间
  • 「轻盈」之旅:OOM故障重现与解决
  • 基于单片机汽车尾灯控制系统
  • Jenkins Pipline流水线
  • 【深度学习基础模型】反卷积神经网络(Deconvolutional Networks, DN)详细理解并附实现代码。
  • 算法笔记(三)——前缀和算法
  • Java项目实战II基于Java+Spring Boot+MySQL的智能物流管理系统(源码+数据库+文档)
  • 用 Python + Selenium + Browser Driver 实现华为手机自动抢购
  • rabbitMq-----路由匹配模块
  • Acwing 简单博弈论
  • HTTP1.0和HTTP1.1有什么区别
  • postgresql-重复执行相同语句,试试 prepare!
  • 爱拼才会赢,甲骨文公司智算中心标配英伟达GPU10万颗
  • 【前沿 热点 顶会】NIPS 2024中目标检测有关的论文
  • 知识图谱入门——4:Protégé 5.6.4安装和主要功能介绍、常用插件(2024年10月2日):知识图谱构建的利器
  • Pikachu-Cross-Site Scripting-反射型xss(post)
  • JavaScript语言基础教程笔记
  • YOLO11改进|注意力机制篇|引入MLCA轻量级注意力机制
  • 【AI知识点】词频-逆文档频率(TF-IDF)
  • 在java中都是如何实现这些锁的?或者说都有哪些具体的结构实现