问答 2024-08-13 来自:开发者社区

你们是如何解决Hudi与Flink的checkpoint一致性问题的?

你们是如何解决Hudi与Flink的checkpoint一致性问题的?

问答 2024-08-13 来自:开发者社区

在Hudi on Flink的初期使用中,你们遇到了哪些问题,并与Hudi社区一起进行了哪些优化?

在Hudi on Flink的初期使用中,你们遇到了哪些问题,并与Hudi社区一起进行了哪些优化?

文章 2024-03-12 来自:开发者社区

假期结束还没缓过神?Hudi on Flink最新进展了解下?

Apache Hudi是由Uber开发并开源的数据湖框架,它于2019年1月进入Apache孵化器孵化,次年5月份顺利毕业晋升为Apache顶级项目。是当前最为热门的数据湖框架之一。 1. 为何要解耦 Hudi自诞生至今一直使用Spark作为其数据处理引擎。如果用户想使用Hudi作为其数据湖框架,就必须在其平台技术栈中引入Spark。放在几年前,使用Spark作为大数据处理引擎可...

假期结束还没缓过神?Hudi on Flink最新进展了解下?
文章 2024-03-12 来自:开发者社区

Apache Hudi + Flink作业运行指南

近日Apache Hudi社区合并了Flink引擎的基础实现(HUDI-1327),这意味着 Hudi 开始支持 Flink 引擎。有很多小伙伴在交流群里咨询 Hudi on Flink 的使用姿势,三言两语不好描述,不如实操演示一把,于是有了这篇文章。 当前 Flink 版本的Hudi还只支持读取 Kafka 数据,Sink到 COW(COPY_ON_WRITE) 类型的 Hudi 表...

Apache Hudi + Flink作业运行指南
文章 2024-03-12 来自:开发者社区

Apache Hudi与Apache Flink更好地集成,最新方案了解下?

1. 现有架构 现有Flink写Hudi架构如下 现有的架构存在如下瓶颈 •InstantGeneratorOperator并发度为1,将限制高吞吐的消费,因为所有的split都将会打到一个线程内,网络IO会...

Apache Hudi与Apache Flink更好地集成,最新方案了解下?
文章 2024-03-12 来自:开发者社区

超详细步骤!整合Apache Hudi + Flink + CDH

1. 环境准备 各组件版本如下 Flink 1.13.1 Hudi 0.10 Hive 2.1.1 CDH 6.3.0 Kafka 2.2.1 1.1 Hudi 代码下载编译 下载代码至本地 steven@wangyuxi...

超详细步骤!整合Apache Hudi + Flink + CDH
文章 2024-03-07 来自:开发者社区

万字长文:基于Apache Hudi + Flink多流拼接(大宽表)最佳实践

1. 背景 经典场景 Flink 侧实现 ...

万字长文:基于Apache Hudi + Flink多流拼接(大宽表)最佳实践
问答 2024-02-26 来自:开发者社区

hudi connector用flink cdc的pipeline配置文件方式提交的话,要怎么改造?

hudi connector用flink cdc的pipeline配置文件方式提交的话,需要怎么改造?

问答 2024-01-09 来自:开发者社区

各位有没有遇到过spark sql查询hudi 数据时没有办法查到flink cdc ?

各位有没有遇到过spark sql查询hudi 数据时没有办法查到flink cdc 同步到hudi实时数据的变化,用hive是没有问题的。但是我重开一个spark sql客户端数据就能发现变化了?

问答 2023-11-08 来自:开发者社区

有没有Hudi on Flink动态同步元数据变化的方法,即读取的kafka数据新增了字段?

有没有Hudi on Flink动态同步元数据变化的方法,即读取的kafka数据新增了字段,需要hudi表也动态新增该字段(这个变化发生在不同天,同一天数据元数据是一致的)。

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云实时计算Flink

一套基于Apache Flink构建的一站式、高性能实时大数据处理平台,广泛适用于流式数据处理、离线数据处理、DataLake计算等场景。

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等