Delta Lake 博客

使用 Delta Lake Vacuum 命令删除旧文件
作者:Matthew Powers 、 Nick Karpov
这篇博文解释了如何使用 Delta Lake Vacuum 命令从存储中删除标记为删除的文件。

将 Delta Lake 表读入 Polars DataFrames
作者:Matthew Powers 、 Chitral Verma
本文演示如何将 Delta Lake 表读入 Polars DataFrames。

使用 Delta Lake、Amazon SageMaker 和 EMR 通过开源为机器学习构建更高效的数据基础设施
作者:Vedant Jain 、 Denny Lee
在这篇博客中,我们将探讨 Delta Lake、Amazon SageMaker Studio 和 Amazon EMR 如何协同工作,从而简化支持数据工程和数据科学项目所需的端到端工作流程。

使用 Delta Sharing 在政府机构之间共享数据
作者:Li Yu 、 Mubashir Kazia 、 Jon D. Ceanfaglione 、 Prabha Rajendran 、 Purushotam Shrestha 、 Shawn A. Benjamin
本文演示了政府机构如何使用 Delta Sharing 共享数据。

为什么 PySpark 在 Delta Lake 中的 append 和 overwrite 写入操作比 Parquet 表更安全
本文向您展示了为什么 PySpark 的 overwrite 操作在 Delta Lake 中更安全,以及不同的保存模式操作在底层是如何实现的。