内容要点:
有状态计算场景:跨批次累加(如统计历史总PV/UV)。

updateStateByKey:全量状态更新,性能较差(每次返回所有key的状态)。

mapWithState:增量状态更新,仅返回更新的key,性能更优。

状态存储:State Store(默认内存/HDFS)和RocksDB(大状态场景)的配置与生命周期管理