文章 2025-03-20 来自:开发者社区

万字长文带你深入广告场景Paimon+Flink全链路探索与实践

作者介绍:黄超傑,蚂蚁数据智能部实时数据团队数据研发工程师,致力于数据湖技术在蚂蚁落地应用、蚂蚁广告实时数仓建设、蚂蚁数据成本治理等工作。 在开始之前 如果: 你想要提升数据时效,能够接受分钟级延迟 你好奇准实时相较离线、实时数据研发究竟能节约多少成本?...

万字长文带你深入广告场景Paimon+Flink全链路探索与实践
文章 2024-11-22 来自:开发者社区

场景实践 | 基于Flink+Hologres搭建GitHub实时数据分析

以GitHub公开事件数据为例,通过使用Flink、Hologres构建实时数仓,实现海量数据实时分析 搭建实时数仓时,Flink可对待处理数据进行实时清洗,完成后Hologres可直接读取Flink中的数据,示例架构如图所示。 一、实践步骤 1、创建专有网络VPC和交换机 登录专有网络管理控制台,单击专有网络。...

场景实践 | 基于Flink+Hologres搭建GitHub实时数据分析
问答 2024-07-30 来自:开发者社区

字节跳动的产品业务场景主要是什么,哪些产品使用了以Flink为支撑的实时计算?

字节跳动的产品业务场景主要是什么,哪些产品使用了以Flink为支撑的实时计算?

问答 2024-06-25 来自:开发者社区

在Flink CDC中我的场景是把变更数据抽到Kafka进行实时计算,这种脏数据应该咋处理?

在Flink CDC中我的场景是把变更数据抽到Kafka进行实时计算,这种脏数据应该咋处理?

问答 2024-04-09 来自:开发者社区

请教下在聚合场景下,如果上游数据出现更新或者删除,如何保证flink sql聚合结果的准确性?

请教下在聚合场景下,如果上游数据出现更新或者删除,如何保证flink sql聚合结果的准确性?

问答 2024-03-06 来自:开发者社区

这种场景阿里云flink引擎有计划吗?

flink 去 lookup join 一张实时写入的维表,在join不到情况下,加入缓存,然后delay retry。这种场景阿里云flink引擎有计划吗?

问答 2023-11-22 来自:开发者社区

现在有这么一个场景flink-cdc 读取MySQLbinlog ,这种情况下是不是从状态恢复不了?

现在有这么一个场景flink-cdc 读取MySQL binlog ,手动做快照停止程序,隔段时间再恢复启动,但由于binlog设置的有归档策略 比如一个小时前的文件都归档到了oss 。这种情况下是不是从状态恢复不了啊,目前应该也不支持读取oss归档的Binlog吧?

问答 2023-11-06 来自:开发者社区

教一下在单向网络环境只支持udp协议的场景下,flink-cdc做实时数据传输可以吗?

大佬们,请教一下在单向网络环境只支持udp协议的场景下,flink-cdc做实时数据传输可以吗?可以用哪些措施来保证对数据传输的可靠性和一致性?

问答 2023-08-28 来自:开发者社区

大佬们,双十一这种场景,Flink如何提前预防数据倾斜呢?

大佬们,双十一这种场景,Flink如何提前预防数据倾斜呢?

问答 2023-03-21 来自:开发者社区

如下问题有没有异常的或者特殊的场景会导致flink处理消息乱序?

大佬们,flink消费kafka,假如kafka分区是3(分区内消息是有序的),如果flink并行度也是3,flink算子也没有做keyby,这种场景下,100%能保证消息是有序消费的吗?有没有异常的或者特殊的场景会导致flink处理消息乱序?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云实时计算Flink

一套基于Apache Flink构建的一站式、高性能实时大数据处理平台,广泛适用于流式数据处理、离线数据处理、DataLake计算等场景。

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问