阿里云文档 2024-12-02

通过SparkStreaming作业处理Kafka数据

本文介绍在阿里云E-MapReduce创建的包含kafka服务的DataFlow集群中,如何使用Spark Streaming作业从Kafka中实时消费数据。

问答 2024-07-29 来自:开发者社区

为什么选择从Kafka + Spark Streaming转向Flink?

为什么选择从Kafka + Spark Streaming转向Flink?

阿里云文档 2024-07-02

如何使用Spark通过ENI网络访问消息队列Kafka版

本文介绍如何使用云原生数据仓库 AnalyticDB MySQL 版Spark通过ENI网络访问消息队列Kafka版。

文章 2024-01-19 来自:开发者社区

使用Kafka与Spark Streaming进行流数据集成

在当今的大数据时代,实时数据处理和分析已经变得至关重要。为了实现实时数据集成和分析,组合使用Apache Kafka和Apache Spark Streaming是一种常见的做法。本文将深入探讨如何使用Kafka与Spark Streaming进行流数据集成,以及如何构建强大的实时数据处理应用程序。 什么是Kafka? Apache Kafka是一个高吞吐量、分布式、持久性的消息系统,用于发...

使用Kafka与Spark Streaming进行流数据集成
阿里云文档 2023-09-13

如何处理Kafka集群的数据_EMR on ECS_开源大数据平台 E-MapReduce(EMR)

本文介绍如何在E-MapReduce的Hadoop集群运行Spark Streaming作业,处理Kafka集群的数据。

阿里云文档 2023-05-25

如何基于云HBase和Spark构建一体化的数据处理平台

云HBase X-Pack是基于Apache HBase、Phoenix、Spark深度扩展,融合Solr检索等技术,支持海量数据的一站式存储、检索与分析。融合云Kafka+云HBase X-Pack能够构建一体化的数据处理平台,支持风控、推荐、检索、画像、社交、物联网、时空、表单查询、离线数仓等场景,助力企业数据智能化。

文章 2022-10-19 来自:开发者社区

Flume+Kafka+Spark Streaming+MySQL实时日志分析

项目背景网络发展迅速的时代,越来越多人通过网络获取跟多的信息或通过网络作一番自己的事业,当投身于搭建属于自己的网站、APP或小程序时会发现,经过一段时间经营和维护发现浏览量和用户数量的增长速度始终没有提升。在对其进行设计改造时无从下手,当在不了解用户的浏览喜欢和个用户群体的喜好。虽然服务器日志中明确的记载了用户访浏览的喜好但是通过普通方式很难从大量的日志中及时有效的筛选出优质信息。Spark S....

Flume+Kafka+Spark Streaming+MySQL实时日志分析
文章 2022-06-12 来自:开发者社区

Storm vs. Kafka Streams vs. Spark Streaming vs. Flink ,流式处理框架一网打尽!2

五、现有流处理框架介绍5.1 StormStorm是最老的流媒体框架,技术成熟可靠。社区也很活跃。ali还开发了jstorm,对storm进行了拓展完善。后续jstorm也融入到storm中,对于storm也是一个质的提升。比较适合于基于事件的一些简单用例场景。优点:极低的延迟,真正的流媒体,成熟和高吞吐量非常适合非复杂的流媒体用例缺点:不支持状态管理没有事件时间处理,聚合,窗口,会话,水印等高....

Storm vs. Kafka Streams vs. Spark Streaming vs. Flink ,流式处理框架一网打尽!2
文章 2022-06-12 来自:开发者社区

Storm vs. Kafka Streams vs. Spark Streaming vs. Flink ,流式处理框架一网打尽!1

文章目录一、前言二、什么是流式处理三、流式处理的重点有哪些3.1 交付保障3.2 故障容错3.3 状态管理3.4 性能3.5 成熟四、流式处理的两种类型4.1 Native流4.2 小批量处理4.3 两种类型都有一些优点和缺点五、现有流处理框架介绍5.1 Storm5.2 Spark Streaming5.3 Flink5.4 Kafka Steams5.5 Kafka Streams vs. ....

Storm vs. Kafka Streams vs. Spark Streaming vs. Flink ,流式处理框架一网打尽!1
问答 2021-12-12 来自:开发者社区

kafka unclean 配置代表什么,会对 spark streaming 消费有什么影响?

kafka unclean 配置代表什么,会对 spark streaming 消费有什么影响?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

消息队列

消息队列是构建分布式互联网应用的基础设施,通过消息队列实现的松耦合架构设计可以提高系统可用性以及可扩展性,是适用于现代应用的优秀设计方案。

+关注