第 2 篇：Iceberg、Delta Lake、Hudi 该怎么看

很多团队做 lakehouse 选型时，最先卷进去的就是表格式之争。但如果开场白是“谁更先进”，后面通常会越聊越虚。

表格式真正决定的，不只是元数据长什么样，而是你的平台怎么处理下面这些事情：

选型先看写入模型

一个非常实用的判断点是：你的主要写入模型是什么。

如果你更多是批处理追加，需求重点在稳定的快照读取和多引擎兼容，那么 Iceberg 往往会是自然候选。

如果你已经在 Spark 生态里深度使用事务和统一平台能力，Delta Lake 的一体化体验会更顺。

如果你的写入高度依赖增量更新、upsert 和近实时导入，Hudi 在一些场景下会更贴近需求。

同样支持时间旅行、Schema 演进，并不意味着运维成本一样。

真正要多问的包括：

选表格式，本质上不是选一个 logo，而是在选未来三年的平台运维模型。