内容要点:

处理乱序数据:为什么不能只依赖处理时间。

水印(Watermark)机制:定义延迟阈值,系统等待一定时间后关闭窗口,丢弃过迟数据。

代码实战:在Structured Streaming聚合查询中使用withWatermark。

输出模式限制:水印必须与Append/Update模式配合使用。