阿里云文档 2025-04-16

通过Apache Airflow提交任务

Apache Airflow是一个强大的工作流程自动化和调度工具,它允许开发者编排、计划和监控数据管道的执行。EMR Serverless Spark为处理大规模数据处理任务提供了一个无服务器计算环境。本文为您介绍如何通过Apache Airflow实现自动化地向EMR Serverless Spark提交任务,以实现作业调度和执行的自动化,帮助您更有效地管理数据处理任务。

阿里云文档 2022-08-22

问题描述Dataphin执行Spark脚本任务,报错“org.apache.spark.sql.AnalysisException: Table or view not found: ...”。解决方案Dataphin的Spark脚本任务,不会对用户的代码进行翻译;需要在任务中直接使用计算源项目名称...

文章 2019-07-23 来自:开发者社区

7月24日晚Spark社区直播:【Apache Spark 基于 Apache Arrow 的列式存储优化】

直播间直达链接:(回看链接) https://tianchi.aliyun.com/course/live?spm=5176.12282027.0.0.5622379ccY33Rf&liveId=41070 时间 7月24日19:00 主讲人: 诚历,阿里巴巴计算平台事业部 EMR 技术专家,Apache Sentry PMC,Apache Commons Committer,目前从事开....

问答 2018-05-27 来自:开发者社区

Improving Python and Spark Performance and Interoperability with Apache Arrow

Yasser Idris在Spark Summit 2017上做了主题为《Improving Python and Spark Performance and Interoperability with Apache Arrow》的演讲,就pyspark UDFs的现阶段发展和局限性,未来提升空间与想法等进行了深入的分享。 https://yq.aliyun.com/download/509...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注
相关镜像
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等