阿里云文档 2025-03-05

Spark作业使用Celeborn作为RSS

Apache Celeborn是一个专门用于处理大数据计算引擎中间数据(如Shuffle数据和溢写数据)的服务,能够提升大数据引擎的性能、稳定性和灵活性。Remote Shuffle Service(RSS)用于高效处理大规模数据集的Shuffle过程。本文介绍如何在ACK集群中部署Celeborn组件,并在Spark作业中使用Celeborn作为Remote Shuffle Service(RS...

阿里云文档 2025-03-05

Spark作业使用Fluid加速数据访问

本文介绍如何使用Fluid加速数据访问,通过JindoRuntime优化OSS数据访问,从而提升数据密集型应用的性能。

阿里云文档 2025-02-26

Spark作业的多集群调度与分发

Apache Spark是一种专门用于大规模数据处理的计算引擎,广泛应用于数据分析和机器学习等场景。本文介绍如何通过ACK One舰队将Spark作业在多集群中进行调度和分发运行,帮助您提升多集群中空闲资源利用率。

阿里云文档 2025-02-26

为Spark作业配置动态资源分配

本文介绍在Spark中如何配置和使用动态资源分配(Dynamic Resource Allocation)功能,以最大化集群资源的利用效率,减少资源闲置,同时提升任务执行的灵活性和整体系统性能。

阿里云文档 2024-12-02

使用日志服务收集Spark作业日志

在ACK集群中运行Spark作业时会生成大量的日志分散在不同的Pods中,导致日志管理变得困难。您可以通过日志服务(SLS)提供的一站式的日志采集、加工、查询与分析、可视化和告警等能力,实现对Spark日志的高效管理。本文将介绍如何使用日志服务(SLS)对运行在ACK集群中的Spark作业日志进行管理。

问答 2021-12-13 来自:开发者社区

Spark支持的集群管理器具体有哪些啊?

Spark支持的集群管理器具体有哪些啊?

问答 2021-12-08 来自:开发者社区

Spark支持的3种集群管理器是什么?

Spark支持的3种集群管理器是什么?

问答 2021-12-07 来自:开发者社区

Spark的内置项目中的集群管理器的作用是什么?

Spark的内置项目中的集群管理器的作用是什么?

问答 2021-12-07 来自:开发者社区

Spark集群管理器是什么?

Spark集群管理器是什么?

问答 2021-12-07 来自:开发者社区

spark支持的集群管理器standalone模式是什么?

spark支持的集群管理器standalone模式是什么?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等