阿里云文档 2024-10-22

如何实现Flink+DLF数据入湖与分析

数据湖构建(DLF)可以结合阿里云实时计算Flink版(Flink VVP),以及Flink CDC相关技术,实现灵活定制化的数据入湖。并利用DLF统一元数据管理、权限管理等能力,实现数据湖多引擎分析、数据湖管理等功能。本文为您介绍Flink+DLF数据湖方案具体步骤。

阿里云文档 2024-09-19

Flink+DLF数据入湖与分析实践

阿里云实时计算Flink版结合DLF Paimon Catalog,实现Flink作业结果到数据湖的高效写入和元数据同步,支持无缝对接多种计算引擎并优化数据湖管理,本文为您介绍具体的操作流程。

阿里云文档 2024-07-17

Flink SQL开发调优实践

说明实时计算Flink版控制台界面和功能可能会发生变化,具体请以实际控制台为准。

文章 2023-11-03 来自:开发者社区

小米基于 Flink 的实时计算资源治理实践

01发展现状与规模如上图所示,下层是基础服务,包括:统一元数据服务、统一权限管理、统一任务调度、统一数据集成。在此之上是各类分布式引擎,包括数据源、数据采集、消息中间件、数据计算和数据查询。Flink 主要位于数据计算模块,目前已经是实时计算事实上的标准,并且正在不断发力离线计算场景,向着更快更稳更易用的批处理引擎迈进。目前,小米 Flink 平台运行着 5000+的用户作业和约 1 万 2 千....

小米基于 Flink 的实时计算资源治理实践
文章 2023-08-09 来自:开发者社区

小米基于 Flink 的实时计算资源治理实践

摘要:本文整理自小米高级软件工程师张蛟,在 Flink Forward Asia 2022 生产实践专场的分享。本篇内容主要分为四个部分: 发展现状与规模框架层治理实践平台层治理实践未来规划与展望 点击查看原文视频 & 演讲PPT 一、发展现状与规模 如上图所示,下层是基础服务,包括:统一元数据服务...

小米基于 Flink 的实时计算资源治理实践
文章 2023-06-01 来自:开发者社区

小米基于 Flink 的实时数仓建设实践

摘要:本文整理自小米软件开发工程师周超,在 Flink Forward Asia 2022 平台建设专场的分享。本篇内容主要分为四个部分: 小米数仓架构演变 Flink+Iceberg 架构升级实践 流批一体实时数仓探索 未来展望 点击查看原文视频 & 演讲PPT 一、小米数仓架构演变 1.1 数仓架构现状 在介绍演变前,我们先来了解下小...

小米基于 Flink 的实时数仓建设实践
文章 2023-05-25 来自:开发者社区

《Apache Flink 案例集(2022版)》——1.数据集成——小米-Flink 流批一体在小米的实践

作者:金风 用户背景 小米科技有限责任公司成立于2010年3月3日,是一家专注于智能硬件和电子产品研发的全球化移动互联网企业,同时也是一家专注于智能手机、互联网电视及智能家居生态链建设的创新型科技企业。 小米公司创造了用互联网模式开发手机操作系统、发烧友参与开发改进的模式。 业务需求小米的大数据发展演变史大概如下:   2019 年之前,小米的实时计算主要以 SparkStreamin....

《Apache Flink 案例集(2022版)》——1.数据集成——小米-Flink 流批一体在小米的实践
文章 2023-05-25 来自:开发者社区

《Apache Flink 案例集(2022版)》——1.数据集成——小米-Flink 流批一体在小米的实践(2)

《Apache Flink 案例集(2022版)》——1.数据集成——小米-Flink 流批一体在小米的实践(1) https://developer.aliyun.com/article/12284723、作业调度 小米在作业调度方面也做了一些尝试。如上图左边这段 SQL,在离线调度模式下它是一个批作业,但在实时调度下它就是一个流作业。在批流混合的调度下,会先启动批作业,执行完成之后再启动流作....

《Apache Flink 案例集(2022版)》——1.数据集成——小米-Flink 流批一体在小米的实践(2)
文章 2023-05-25 来自:开发者社区

《Apache Flink 案例集(2022版)》——1.数据集成——小米-Flink 流批一体在小米的实践(3)

《Apache Flink 案例集(2022版)》——1.数据集成——小米-Flink 流批一体在小米的实践(2) https://developer.aliyun.com/article/12284702. 实时数据集成  主要分为两个部分:  第一部分是实时数据的收集,小米内部主要分为两大类, 分别是日志数据和 DB 的 Binlog 数据。这里主要介绍 DB 系统的 B....

《Apache Flink 案例集(2022版)》——1.数据集成——小米-Flink 流批一体在小米的实践(3)
文章 2023-05-25 来自:开发者社区

《Apache Flink 案例集(2022版)》——1.数据集成——小米-Flink 流批一体在小米的实践(3)

2. 实时数据集成  主要分为两个部分:  第一部分是实时数据的收集,小米内部主要分为两大类, 分别是日志数据和 DB 的 Binlog 数据。这里主要介绍 DB 系统的 Binlog 数据收集。最初小米使用自研的 LCS Binlog 服务来进行统一的 Binlog 收集,类似于 Canal 服务,通过该服务将 Binlog 的数据统一收集到消息队列中。  第二部....

《Apache Flink 案例集(2022版)》——1.数据集成——小米-Flink 流批一体在小米的实践(3)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等