阿里云文档 2025-07-04

通过RootPolicy访问OSS-HDFS

OSS-HDFS服务支持RootPolicy。通过RootPolicy,您可以为OSS-HDFS服务设置自定义前缀。此功能使得Serverless Spark能够在无需修改原有访问hdfs://前缀的任务的情况下,直接操作OSS-HDFS上的数据。

阿里云文档 2025-07-04

管理自定义配置文件

自定义配置文件功能支持根据特定需求创建个性化配置,灵活控制任务执行环境。支持多种文件格式(如XML和JSON),确保配置的安全性和一致性,并可直接应用于各类任务(如批处理、会话等)。

阿里云文档 2025-07-04

管理Spark配置模板

Spark配置模板用于定义全局默认配置,支持创建、编辑和管理任务运行所需的参数。通过集中维护 Spark 配置信息,确保任务执行的一致性和灵活性,同时支持动态更新以满足多样化业务需求。

阿里云文档 2025-06-16

读写MySQL

Spark原生支持通过JDBC Connector访问MySQL。Serverless Spark在启动时将自动加载MySQL JDBC驱动(版本 8.0.33)。您可以通过SQL会话、批处理任务或Notebook等方式连接MySQL,从而实现数据的读取与写入操作。

阿里云文档 2025-06-13

2025-06-05版本说明

本文为您介绍2025年06月05日发布的EMR Serverless Spark的功能变更。

文章 2025-01-27 来自:开发者社区

Spark 与 MapReduce 的 Shuffle 的区别?

park 和 MapReduce 在 Shuffle 过程中有一些重要的区别。以下是它们的主要区别: 1. 执行模型 MapReduce:MapReduce 是一个两阶段的执行模型,包括 Map 阶段和 Reduce 阶段。在 Map 阶段,数据被处理并生成中间键值对;在 Reduce 阶段,这些键值对被聚合和处理。 Spark:Spark 使用基于内存的执...

问答 2022-02-15 来自:开发者社区

spark on yarn 和 mapreduce 中 yarn 有什么区别

spark on yarn 和 mapreduce 中 yarn 有什么区别

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问