流程业务监控设计一览
初衷:为了流程开放平台的高可用,可监控,快速报警,人员快速响应问题解决,更重要的就是用户体验,因为你app的响应时间很大程度影响用户喜好,所以我们项目对监控内容作了详细划分
监控工具:cat打点,granafa监控配置,运维监控报警平台
监控分类
一.系统层监控
这一块基本不用业务开发设计,目前的cat,zabbx等都提供基础监控:gc,redis,mysql,io,带宽等等
二.业务监控
1.接口响应时间监控,报警频率不需要每次超过阙值就报警,一般超过阙值的频率10/s就需要报警
2.被调用接口请求量监控,这个监控主要是为了防范调用方和黑客攻击,一样超过阙值范围需要报警,我们服务是有多租户的分布式限流的,会统计监控具体的租户,做溯源。
3.调用外部接口的响应监控,这个主要是为了防范外部系统超时,响应慢导致自己服务出现问题,当然有各种熔断重试机制(接入hystrix监控),但是我们的目标是自己打点监控统计到公司平台,毕竟很多公司都有自己的技术栈
4.业务监控细分,比如我们流程中心为了快速发现问题,需要将流程扭转,人员,表单,java异常等不同内部领域的异常分别报警给相关负责人,我们的做法是不同领域定义不同的异常类extends Exception,在同一异常拦截中心进行捕获上报
在运维监控平台增加规则拦截,每个异常配置一个服务人,进行报警
版权声明:本文为qq1076472549原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。