阿里云文档 2025-05-27

基于DLF、RDS或Flink、OSS支持Delta Lake或Hudi存储机制

MaxCompute基于阿里云DLF、RDS或Flink、OSS产品,构建了支持Delta Lake和Hudi存储机制的湖仓一体架构。该架构中的Delta Lake和Hudi是数据湖方案中常用的存储机制,为数据湖提供流处理、批处理能力。可以通过MaxCompute查询实时数据,以便及时洞察业务数据的变化。

阿里云文档 2025-02-28

hudi连接器

本文为您介绍如何使用Hudi连接器。

文章 2024-03-12 来自:开发者社区

Flink CDC + Hudi + Hive + Presto构建实时数据湖最佳实践

1. 测试过程环境版本说明 Flink1.13.1 Scala2.11 CDH6.2.0 Hadoop3.0.0 Hive2.1.1 Hudi0.10(master) PrestoDB0.256 Mysql5.7 2. 集群服务器基础环境 2.1 Maven和JDK环境版本 ...

Flink CDC + Hudi + Hive + Presto构建实时数据湖最佳实践
文章 2024-02-26 来自:开发者社区

飞书深诺基于Flink+Hudi+Hologres的实时数据湖建设实践

一、背景介绍 飞书深诺集团致力于在出海数字营销领域提供全链路服务产品,满足不同企业的全球化营销需求。在广告效果监控和游戏运营业务场景中,为了及时响应广告投放成效与消耗方面的问题和快速监测运营动作效果,实时或准实时数据处理提供了至关重要的技术支撑。 通过对各个业务线实时需求的调研了解到,当前实时数据处理场景是各个业务线基于Java服务独自处理的。各个业务线实时能力不能复用且存在计算...

飞书深诺基于Flink+Hudi+Hologres的实时数据湖建设实践
文章 2021-04-21 来自:开发者社区

Flink + Hudi 在 Linkflow 构建实时数据湖的生产实践

可变数据的处理一直以来都是大数据系统,尤其是实时系统的一大难点。在调研多种方案后,我们选择了 CDC to Hudi 的数据摄入方案,目前在生产环境可实现分钟级的数据实时性,希望本文所述对大家的生产实践有所启发。内容包括:背景CDC 和数据湖技术挑战效果未来计划总结一、背景Linkflow 作为客户数据平台(CDP),为企业提供从客户数据采集、分析到执行的运营闭环。每天都会通过一方数据采集端点(....

Flink + Hudi 在 Linkflow 构建实时数据湖的生产实践

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云实时计算Flink

一套基于Apache Flink构建的一站式、高性能实时大数据处理平台,广泛适用于流式数据处理、离线数据处理、DataLake计算等场景。

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问