当前位置: 首页 > news >正文

Flink 翻滚窗口、滑动窗口、会话窗口核心区别

        Flink 中的翻滚窗口(Tumbling Window)滑动窗口(Sliding Window)会话窗口(Session Window)是处理流数据的三大核心窗口类型,用于将无限的流数据切割为有限的 “数据块” 进行批量计算。三者的核心差异体现在窗口划分方式、数据重叠性、触发机制上,适用于不同的业务场景。以下是详细的对比与解析。

一、核心定义与窗口划分逻辑

1. 翻滚窗口(Tumbling Window):固定大小、无重叠、连续划分

        翻滚窗口是大小固定、无重叠、连续划分的窗口,数据会被严格分配到一个且仅一个窗口中,窗口之间无缝衔接。

  • 划分规则:以固定的时间 / 数据量间隔划分窗口,例如:
    • 时间翻滚窗口:每 5 分钟一个窗口(00:00-00:05、00:05-00:10、00:10-00:15……);
    • 计数翻滚窗口:每 100 条数据一个窗口(1-100 条、101-200 条、201-300 条……)。
  • 核心特点:窗口之间完全独立,无数据重叠,计算结果是 “阶段性的完整统计”。
  • 形象比喻:像切面包一样,将流数据切成一段段等长的面包片,每片之间没有重叠。

2. 滑动窗口(Sliding Window):固定大小、有重叠、滑动步长控制

        滑动窗口是大小固定、可重叠的窗口,窗口的划分由 ** 窗口大小(Window Size)滑动步长(Slide Step)** 两个参数控制。

  • 划分规则
    • 窗口大小:窗口的时间 / 数据量长度(如 5 分钟);
    • 滑动步长:窗口每次滑动的时间 / 数据量间隔(如 2 分钟)。例如:
    • 时间滑动窗口:窗口大小 5 分钟,滑动步长 2 分钟(00:00-00:05、00:02-00:07、00:04-00:09……);
    • 计数滑动窗口:窗口大小 100 条,滑动步长 50 条(1-100 条、51-150 条、101-200 条……)。
  • 核心特点:数据可能被分配到多个窗口中(重叠部分的数据会被多次计算),计算结果是 “高频的增量统计”。
  • 关键参数关系
    • 当滑动步长 = 窗口大小时,滑动窗口退化为翻滚窗口;
    • 当滑动步长 < 窗口大小时,窗口存在重叠(最常见场景);
    • 当滑动步长 > 窗口大小时,窗口之间会出现间隙(数据可能被遗漏,极少使用)。

3. 会话窗口(Session Window):无固定大小、基于超时、非连续划分

        会话窗口是 ** 无固定大小、基于会话超时(Session Gap)** 划分的窗口,用于处理间歇性的数据流,窗口的开始和结束由数据的到达时间决定。

  • 划分规则
    • 当有数据到达时,若当前
http://www.cnnetsun.cn/news/113900.html

相关文章:

  • Xiaomi 商城页面布局(部分)
  • FPGA以太网升级程序:便捷qspi Flash升级,具备校验功能,适用于Xilinx 7系列...
  • 运料小车装卸料控制:西门子1200PLC与TP700触摸屏联机仿真博途16
  • S32K311启动过程中,向量表重定向
  • 从蓝图到产线:高效产品信息传递的桥梁建设
  • 时间复杂度
  • 网站建设公司怎么选?2025年网站设计制作公司推荐指南
  • 今天咱们来聊一个挺有意思的优化算法改进——基于透镜成像反向策略的海洋捕食者算法。这个改进版本在原始MPA基础上搞了点新花样,咱们直接上干货看代码实现
  • Gitee:本土化DevOps平台如何重塑中国开发者生态
  • vCenter Server 8.0U3h 新增功能简介
  • Cisco NX-OS 10.6(2)F 发布 - 数据中心网络操作系统
  • Ubuntu24.04无操作卡死,无法唤醒问题以及内核版本切换记录
  • 全场景覆盖・全流程智控:分布式解决方案让多功能厅 “不止于多”
  • 【轨物方案】聚焦锯床设备智能化升级,打造工业互联网新范式
  • 【轨物交流】轨物科技亮相2025高校科技成果交易会
  • cesium加载geotiff的 四种方法
  • 【毕业设计】基于python的运维管理平台的设计与实现
  • 苹果 iOS 开发真正复杂的不是写代码这方面,是证书、构建、上架
  • FSMC-TFTLCD显示实验(5):显示一个字符串的函数传递过程追踪~
  • 基于Android的课程考勤及作业提交系统
  • 飞易通蓝牙与Wi-Fi模块:医疗产品无线连接的全能助手
  • 你的音效素材库该升级了!这个网站的分类细到超出你想象
  • Agent的“话痨”病有救了!微软黑科技教你压缩对话历史,让AI告别失忆,这篇教程太顶了!
  • ARMv7 linux中断路由以及处理
  • 【详解】基于Kubernetes部署Kafka集群
  • AIoT:从万物互联到万物智联的进化之路
  • ERROR in ./node_modules/vue-router/dist/vue-router.mjs 被报错折磨半天?真相竟是……
  • Spring Boot 自动配置的底层实现原理
  • AI如何帮你快速掌握Wireshark端口过滤技巧
  • 手把手教你复现CVE-2023-51767漏洞