The Linux Foundation Projects
Delta Lake
logo

Delta Lake 集成

使用以下框架、Delta Sharing 客户端、托管服务和/或社区集成
支持 Delta Lake 和 Delta Sharing。

UniForm

Delta 统一格式 (UniForm)
允许您使用 Iceberg 和 Hudi 客户端读取 Delta 表

要求 启用 UniForm

框架

使用以下框架和语言,包括但不限于 Apache Flink、Apache Spark、Trino 和 Rust。

Apache Druid

Druid

此连接器允许 Apache Druid 从 Delta Lake 读取数据。

Apache Flink

Flink独立

此连接器允许 Apache Flink 写入 Delta Lake。

Apache Hive

Hive独立

此连接器允许 Apache Hive 从 Delta Lake 读取数据。

Apache Pulsar

Pulsar社区

此连接器允许 Apache Pulsar 从 Delta Lake 读取和写入数据。

Apache Spark™

Spark

此连接器允许 Apache Spark™ 从 Delta Lake 读取和写入数据。

ClickHouse

ClickHouse

ClickHouse 是一个面向列的数据库,允许用户在 Delta Lake 表上运行 SQL 查询。这提供了与 Amazon S3 中现有 Delta Lake 表的只读集成。

Dagster

DagsterPython

在您的 Dagster 编排管道中使用 Delta Lake IO 管理器从 Delta Lake 读取和写入数据。

Delta Rust API

RustPython

此库允许 Rust(带 Python 绑定)低级别访问 Delta 表,旨在与 datafusion、ballista、rust-dataframe、vega 等数据处理框架一起使用。

Delta Standalone

ScalaJava独立

此库允许基于 Scala 和 Java 的项目(包括 Apache Flink、Apache Hive、Apache Beam 和 PrestoDB)从 Delta Lake 读取和写入数据。

FINOS Legend

FINOSLegend

FINOS Legend 框架的扩展,适用于基于 Apache Spark™ / Delta Lake 的环境,结合了开放数据标准和开源技术的优势。此连接器允许 Trino 从 Delta Lake 读取和写入数据。

Hopsworks

HopsworksPython

Hopsworks Feature Store 在 Delta Lake 中存储、管理和提供特征数据。

Kafka Delta Ingest

KafkaRust

此项目构建了一个高效的守护进程,用于通过 Apache Kafka 将数据流式传输到 Delta Lake。

PrestoDB

PrestoDB独立

此连接器允许 PrestoDB 从 Delta Lake 读取数据。

RisingWave

RisingWave独立

此连接器允许 RisingWave 写入 Delta Lake。

SQL Delta Import

SQLJDBC

此实用程序用于将数据从 JDBC 源导入 Delta Lake 表。

StarRocks

StarRocks

StarRocks 是 Linux 基金会的一个项目,是用于多维分析、实时分析和即席查询等所有分析场景的下一代亚秒级 MPP OLAP 数据库。StarRocks 能够从 Delta Lake 读取数据。

Trino

Trino

此连接器允许 Trino 从 Delta Lake 读取和写入数据。

分享

使用以下与 Delta Sharing 集成的客户端,从 C++ 到 Rust。

C++

C++Delta Sharing社区

此连接器允许 C++ 客户端从 Delta Sharing 端点读取数据。

Excel

ExcelDelta Sharing

此连接器允许 Excel 客户端从 Delta Sharing 端点读取数据。

Go

GoDelta Sharing社区

此连接器允许 Go 客户端从 Delta Sharing 端点读取数据。

Java

JavaDelta Sharing社区

此连接器允许 Java 客户端从 Delta Sharing 端点读取数据。

Kotosiro Sharing

KotosiroDelta SharingRust

Delta Sharing 服务器的极简 Rust 实现。

MLflow

MLflowDelta Sharing社区

通过 Delta Sharing 和 MLflow 执行模型交换

node.js

node.jsDelta Sharing社区

此连接器允许 node.js 从 Delta Sharing 端点读取数据。

Oracle

OracleDelta Sharing

此连接器允许与 Oracle Autonomous Database Data Studio 进行 Delta Sharing。

Power BI

PowerBIDelta Sharing

此连接器允许 Power BI 从 Delta Sharing 端点读取数据。

R

RDelta Sharing社区

此连接器允许 R 客户端从 Delta Sharing 端点读取数据。

Rust

RustDelta Sharing社区

此连接器允许 Rust 客户端从 Delta Sharing 端点读取数据。

终端

终端Delta Sharing社区

用于浏览 Delta Sharing 元数据的终端应用程序。

服务

使用您选择的与 Delta Lake 集成的托管服务。

Athena

AthenaAWS

此实用程序允许 Athena 从 Athena SQL 3.0 开始原生读取 Delta Lake。

AWS EMR

AWSEMR

从 Amazon EMR 6.9.0 版本开始,您可以使用 Amazon EMR 集群上的 Apache Spark 3.x 处理 Delta Lake 表。

AWS Glue

AWSGlue

AWS Glue 3.0 及更高版本支持 Linux 基金会 Delta Lake 框架。

aws-pandas-sdk

pandasAWSawswrangleraws-pandas-sdk

AWS 上的 pandas - 轻松集成 AWS 服务,包括对 Delta Lake 的可选依赖。

Azure Stream Analytics

AzureASAStream Analytics

Azure Stream Analytics 为 Delta Lake 提供原生写入支持。

BigQuery

BigQuery 的原生 Delta Lake 支持可为下游应用程序提供无缝数据传输。

Databricks

DatabricksAzureGCPAWS

Databricks 中包含 Delta Lake,允许它从 Delta Lake 读取和写入数据。

Microsoft Fabric

为了在 Microsoft Fabric 的所有计算引擎中实现无缝数据访问,Delta Lake 被选作统一的表格式。

Power BI

PowerBI社区

此连接器允许 Power BI 从 Delta Lake 读取数据。

Redshift

RedshiftAWS清单

此实用程序允许 AWS Redshift 使用清单文件从 Delta Lake 读取数据。

Snowflake (Beta)

Snowflake

此预览版允许 Snowflake 通过外部表从 Delta Lake 读取数据。

Starburst

StarburstAzureGCPAWS

Starburst Delta Lake 连接器是 Trino/Delta Lake 连接器的扩展版本,配置和使用方式相同。

StarTree

StarTreePinot

StarTree Cloud 包含 Apache Pinot / Delta Lake 连接器。

社区

尝试以下与 Delta Lake 的社区集成。

Apache Beam

Beam独立社区

此连接器允许 Apache Beam 从 Delta Lake 读取数据。

Athena 查询联邦 (Beta)

AWSAthena独立社区

此连接器允许 AWS Athena 从 Delta Lake 读取数据。

Beam Delta Lake

Beam独立社区

借助 DataLakeIO,可以从 Apache Beam 的管道中读取和写入 Delta Lake 数据。

Ceph

Ceph社区

此连接器允许您在 Ceph 存储上读取和写入 Delta 表。

dlt | SparkR

SparkR社区

此软件包允许 SparkR 从 Delta Lake 读取和写入数据。

DataHub

DataHub社区

此连接器允许 DataHub 提取 Delta Lake 元数据。

Datastream 连接器

GCSDatastreambadal.io社区

由于 Datastream 将更改流式传输到 Google Cloud Storage 中的文件,此连接器会流式传输这些文件并将更改写入 Delta Lake。

MinIO

MinIO社区

此连接器允许您在 MinIO 存储上读取和写入 Delta 表。