阿里云文档 2024-12-06

通过Apache Airflow向EMR Severless Spark提交任务

Apache Airflow是一个强大的工作流程自动化和调度工具,它允许开发者编排、计划和监控数据管道的执行。EMR Serverless Spark为处理大规模数据处理任务提供了一个无服务器计算环境。本文为您介绍如何通过Apache Airflow实现自动化地向EMR Serverless Spark提交任务,以实现作业调度和执行的自动化,帮助您更有效地管理数据处理任务。

文章 2023-09-26 来自:开发者社区

杭州 Meetup| Apache Kyuubi & Celeborn,助力 Spark 拥抱云原生

Apache Spark 作为如今大数据离线计算领域事实标准,被广泛应用。Apache Celeborn (Incubating)是大数据引擎统一中间数据服务,除了支持 Shuffle,未来还会支持 Spilled data,帮助计算节点解除对大容量本地盘的依赖。这是在阿里云上诞生的第一个 Apache 孵化项目。2022 年 10 月正式进入 Apache 孵化器,截至目前我们积累了1200+....

杭州 Meetup| Apache Kyuubi & Celeborn,助力 Spark 拥抱云原生
文章 2023-09-01 来自:开发者社区

Apache Kyuubi & Celeborn (Incubating) 助力 Spark 拥抱云原生

本文整理自网易数帆软件工程师潘成,在 ASF CommunityOverCode Asia 2023(北京)的分享。本篇内容主要为: Spark 云原生的收益和挑战如何基于 Apache Kyuubi 构建统一 Spark 任务网关如何基于 Apache Celeborn (Incubating) 构建 Shuffle Service网易在...

Apache Kyuubi & Celeborn (Incubating) 助力 Spark 拥抱云原生
文章 2023-08-24 来自:开发者社区

Apache Celeborn 让 Spark 和 Flink 更快更稳更弹性

摘要:本文整理自阿里云/数据湖 Spark 引擎负责人周克勇(一锤)在 Streaming Lakehouse Meetup 的分享。内容主要分为五个部分: Apache Celeborn 的背景Apache Celeborn——快Apache Celeborn——稳Apache Celeborn——弹Evaluation 点击查看原文视...

Apache Celeborn 让 Spark 和 Flink 更快更稳更弹性
阿里云文档 2022-08-22

问题描述Dataphin执行Spark脚本任务,报错“org.apache.spark.sql.AnalysisException: Table or view not found: ...”。解决方案Dataphin的Spark脚本任务,不会对用户的代码进行翻译;需要在任务中直接使用计算源项目名称...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注
相关镜像
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等