文章 2024-10-19 来自:开发者社区

分布式锁服务深度解析:以Apache Flink的Checkpointing机制为例

背景 在分布式系统中,多个进程或节点可能需要同时访问和操作共享资源。为了确保数据的一致性和系统的稳定性,我们需要一种机制来协调这些进程或节点的访问,避免并发冲突和竞态条件。分布式锁服务正是为此而生的一种解决方案。它通过在网络环境中实现锁机制,确保同一时间只有一个进程或节点能够访问和操作共享资源。 使用场景 分布式锁服务在多种场景下都有广泛的应用。例如: ...

文章 2024-05-31 来自:开发者社区

分布式计算框架比较:Hadoop、Spark 与 Flink

在大数据处理领域,Hadoop、Spark 和 Flink 是三个非常重要的分布式计算框架,它们各自有着独特的特点和优势。 Hadoop 是分布式计算的先驱框架。它主要由 HDFS(分布式文件系统)和 MapReduce(计算框架)组成。Hadoop 擅长处理大规模的批量数据处理任务,具有高度的可扩...

文章 2024-03-04 来自:开发者社区

基于 Kyuubi 实现分布式 Flink SQL 网关

本文整理自网易互娱资深开发工程师、Apache Kyuubi Committer 林小铂的《基于 Kyuubi 实现分布式 Flink SQL 网关》分享,内容主要分为以下四部分: Kyuubi 是什么Kyuubi 架构设计Flink x Kyuubi 优势未来展望 一. Kyuubi 是什么 1.1. Kyuubi 简介 简单来说,Kyuubi 是一...

基于 Kyuubi 实现分布式 Flink SQL 网关
文章 2022-01-16 来自:开发者社区

最火热的分布式流式处理引擎-Flink入门介绍

一、什么是Flink?Flink是目前流行的分布式流式处理引擎,是Apache的顶级项目。Flink支持高吞吐、低延迟、高性能、Exactly-Once语义等特性,同时其基于"批是特殊的流"的理念,既实现了流式处理计算,又实现了批处理计算,达到了真正意义上的批流统一。Flink具备极高的处理能力,集群可达数千服务器的规模。目前在国内已经被广泛接受,一些著名的互联网公司,如阿里巴巴、美团、滴滴、今....

最火热的分布式流式处理引擎-Flink入门介绍
文章 2021-08-25 来自:开发者社区

分布式计算引擎 Flink/Spark on k8s 的实现对比以及实践

以 Flink 和 Spark 为代表的分布式流批计算框架的下层资源管理平台逐渐从 Hadoop 生态的 YARN 转向 Kubernetes 生态的 k8s 原生 scheduler 以及周边资源调度器,比如 Volcano 和 Yunikorn 等。这篇文章简单比较一下两种计算框架在 Native Kubernetes 的支持和实现上的异同,以及对于应用到生产环境我们还需要做些什么。1. 什....

分布式计算引擎 Flink/Spark on k8s 的实现对比以及实践
问答 2019-12-24 来自:开发者社区

如果想搭建一套分布式的训练集群,除了kafka、TensorFlow、hadoop、flink、zo

如果想搭建一套分布式的训练集群,除了kafka、TensorFlow、hadoop、flink、zookeeper,还需要搭建什么吗? 本问题来自阿里云开发者社区的【11大垂直技术领域开发者社群】。 点击这里欢迎加入感兴趣的技术领域群。

问答 2018-12-10 来自:开发者社区

用于保持访问配置数据<10 GB的最佳分布式缓存,并从Flink流应用程序访问每条记录?

我的数据不会超过10 GB,我需要将它放在分布式缓存中并为每条记录访问它以便从我的Flink流应用程序进行验证。哪一个最适合这个用例?我在hazelcast和redis之间感到困惑。

文章 2018-02-08 来自:开发者社区

分布式Snapshot和Flink Checkpointing简介

阿里巴巴实时计算部-昆仑 最近在学习Flink的Fault Tolerance,了解到Flink在Chandy Lamport Algorithm的基础上扩展实现了一套分布式Checkpointing机制,这个机制在论文"Lightweight Asynchronous Snapshots for Distributed Dataflows"中进行了详尽的描述。怀着对Lamport大神的敬仰,我....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云实时计算Flink

一套基于Apache Flink构建的一站式、高性能实时大数据处理平台,广泛适用于流式数据处理、离线数据处理、DataLake计算等场景。

+关注