阿里云文档 2025-03-03

如何通过数据集成实时入湖

本文以Kafka实时入湖写入至OSS场景为例,为您介绍如何通过数据集成实时入湖OSS(HUDI)。

阿里云文档 2024-12-30

基于Hadoop集群支持Delta Lake或Hudi存储机制

Delta Lake和Hudi是数据湖方案中常用的存储机制,为数据湖提供流处理、批处理能力。MaxCompute基于开源的Hadoop集群提供了支持Delta或Hudi存储机制的湖仓一体架构。您可以通过MaxCompute查询到实时数据,即时洞察业务数据变化。

阿里云文档 2024-10-08

Hudi Catalog

Hudi Catalog是一种External Catalog。通过Hudi Catalog,您不需要执行数据导入就可以直接查询Apache Hudi里的数据。此外,您还可以基于Hudi Catalog ,结合INSERT INTO能力来实现数据转换和导入。StarRocks从2.4版本开始支持Hudi Catalog。

阿里云文档 2024-09-14

Hudi数据源

Apache Hudi是一种数据湖存储格式,在Hadoop文件系统之上提供了更新数据、删除数据以及消费变化数据的能力,详情请参见Apache Hudi。本文为您介绍如何在EMR Serverless Spark中实现Hudi表的读取与写入操作。

阿里云文档 2024-07-02

Hudi CDC功能的参数和使用示例

本文为您介绍Hudi CDC功能的相关参数和使用示例。

问答 2021-12-12 来自:开发者社区

基于Delta lake、Hudi格式的湖仓一体的主要数据链路是什么?

基于Delta lake、Hudi格式的湖仓一体的主要数据链路是什么?

问答 2021-12-12 来自:开发者社区

基于Delta lake、Hudi格式的湖仓一体的特点是什么?

基于Delta lake、Hudi格式的湖仓一体的特点是什么?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

云原生大数据计算服务 MaxCompute您可能感兴趣

产品推荐

大数据计算 MaxCompute

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等