每条故障写五件事:发生时间、影响范围、根本原因、处置动作、验证结果。时间写到分钟,范围写清服务名称和用户群,比如“影响OA系统登录,波及财务部全体终端”。原因不写“设备老化”,写“ATS切换模块触点氧化导致延时1.7秒”。处置动作写谁干的、怎么干的、用了什么工具。最后那句验证结果必须可感知,比如“所有终端30秒内恢复登录”。