阿里云文档 2025-04-16

通过Apache Airflow提交任务

Apache Airflow是一个强大的工作流程自动化和调度工具,它允许开发者编排、计划和监控数据管道的执行。EMR Serverless Spark为处理大规模数据处理任务提供了一个无服务器计算环境。本文为您介绍如何通过Apache Airflow实现自动化地向EMR Serverless Spark提交任务,以实现作业调度和执行的自动化,帮助您更有效地管理数据处理任务。

文章 2023-01-18 来自:开发者社区

《Hive Bucketing in Apache Spark》电子版地址

《Hive Bucketing in Apache Spark》Hive Bucketing in Apache Spark 电子版下载地址: https://developer.aliyun.com/ebook/2388 电子书: </div>

《Hive Bucketing in Apache Spark》电子版地址
阿里云文档 2022-08-22

问题描述Dataphin执行Spark脚本任务,报错“org.apache.spark.sql.AnalysisException: Table or view not found: ...”。解决方案Dataphin的Spark脚本任务,不会对用户的代码进行翻译;需要在任务中直接使用计算源项目名称...

问答 2018-05-27 来自:开发者社区

Hive Bucketing in Apache Spark

Tejas Patil在Spark Summit 2017上做了主题为《Hive Bucketing in Apache Spark》的演讲,就为什么使用bucketing,如何避免shuffle等进行了深入的分享。 https://yq.aliyun.com/download/493?spm=a2c4e.11154804.0.0.48f86a799FXX1d

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注
相关镜像
X