阿里云文档 2025-03-04

Dataflow集群如何连接DLF,并读取Hudi全量数据

DataFlow集群可以通过数据湖构建(DLF)的统一元数据服务,访问DataLake集群或自定义集群中的Hudi表数据。本文为您介绍DataFlow集群如何连接DLF并读取Hudi全量数据。

文章 2023-06-12 来自:开发者社区

数据湖的选型(delta iceberg hudi)以及比对

数据湖的选型此文章只是作为文稿记录,且截止到2022年11月份Hudi(0.12.0)支持spark 3.3.x 3.1.x是 Hadoop Upserts Deletes and Incrementals 的简写Hudi在华为的实践1。clustering支持常见的order以及z-order(里面以后优化https://github.com/delta-io/delta/pull/1149)....

文章 2023-03-17 来自:开发者社区

数据湖选型指南|Hudi vs Iceberg 数据更新能力深度对比

数据湖作为新一代大数据基础设施,近年来持续火热,许多前线的同学都在讨论数据湖应该怎么建,许多企业也都在构建或者计划构建自己的数据湖。基于此,自然引发了许多关于数据湖选型的讨论和探究。但是经过搜索之后我们发现,网上现存的很多内容都是基于较早之前的开源信息做出的结论,在企业调研初期容易造成不准确的印象和理解。因此带着这样的问题,我们计划推出数据湖选型系列文章,基于最新的开源信息,从升级数据湖架构的几....

数据湖选型指南|Hudi vs Iceberg 数据更新能力深度对比

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐