Flink CDC 生产环境监控与告警处理完整指南
目录
- 监控体系设计
- 核心监控指标
- 告警配置
- 告警处理流程
- 常见问题解决方案
监控体系设计
设计原则
1. 监控结果而非过程
核心理念:关注用户体验指标(数据延迟)而非内部指标(错误数)
- ✅推荐:监控 CDC 延迟(
millisBehindLatest) - ❌不推荐:监控输出错误数(
numRecordsOutErrors)
<
核心理念:关注用户体验指标(数据延迟)而非内部指标(错误数)
millisBehindLatest)numRecordsOutErrors)<