日常监控不是报数字。写你盯的是哪几个指标,为什么盯它,比如CPU连续三分钟超85%你就去查进程,流量突增200%你就翻接口错误计数。值不值钱,看你有没有把数字和判断挂钩。别列一串阈值,要写你哪次靠它抢在故障前动手了。