阿里云文档 2025-08-25

使用DLF

本文介绍了如何在EMR Serverless Spark中开发并运行一个基于数据湖构建(DLF)的Paimon表写入任务。通过上传测试文件、创建任务并运行,最终可以通过日志探查或控制台查看结果,验证数据写入和查询的正确性。

阿里云文档 2025-08-21

使用Delta Lake

Delta Lake是一个开源存储框架,旨在数据湖之上构建LakeHouse架构。Delta Lake提供了ACID事务支持、可扩展的元数据处理功能,并能够在现有的数据湖(如OSS、Amazon S3和HDFS)上整合流处理与批处理。此外,Delta Lake还支持多种引擎,如Spark、PrestoDB和Flink,以及多种编程语言的API,包括Scala、Java、Rust和Python,以便...

阿里云文档 2025-08-13

配置Livy Gateway以启用Ranger鉴权,实现细粒度访问控制和安全策略管理。

Apache Ranger提供了集中式的权限管理框架。通过与Spark结合使用的Ranger Plugin,可以对Spark SQL访问数据库、表和列等进行细粒度的权限控制,从而增强数据访问的安全性。Livy Gateway支持配置Ranger Plugin来启用数据访问的权限控制。

阿里云文档 2025-08-01

PAI-DSW连接EMR Serverless Spark提交PySpark任务

阿里云人工智能PAI-DSW提供了云端AI开发IDE或开发机,内置多种开发环境,可以快速开始模型开发。您可以在DSW中,利用Serverless Spark提供的Livy API,远程连接Serverless Spark,并将PySpark任务提交至服务端进行执行。

阿里云文档 2025-08-01

执行角色

EMR Serverless Spark工作空间中的任务在调用其他阿里云服务(如OSS、DLF)时,将通过执行角色进行权限验证。在创建工作空间时,您既可以使用默认执行角色,也可以使用自定义的角色。

问答 2024-09-26 来自:开发者社区

Dataworks 里的 ODPS spark 节点访问不到 maxcompute 里的表

Dataworks 里的 ODPS spark 节点访问不到 maxcompute 里的表,show tables 结果是空的

问答 2024-07-31 来自:开发者社区

大数据计算MaxCompute 想申请加到spark公网访问白名单,可以从哪边申请?

大数据计算MaxCompute 想申请加到spark公网访问白名单,可以从哪边申请?

文章 2024-06-23 来自:开发者社区

MaxCompute操作报错合集之在Spark访问OSS时出现证书错误的问题,该如何解决

问题一:大数据计算MaxCompute 这个正常吗? 大数据计算MaxCompute 这个正常吗? https://dataworks.data.aliyun.com/ap-southeast-1/workbench?defa...

MaxCompute操作报错合集之在Spark访问OSS时出现证书错误的问题,该如何解决
问答 2024-06-15 来自:开发者社区

Maxcompute spark访问oss对象存储是否可以走ENI方式

Maxcompute spark访问oss对象存储是否可以走ENI方式

问答 2024-05-29 来自:开发者社区

MaxCompute spark访问oss外部表报错Odps external table i...

MaxCompute spark访问oss外部表报错Odps external table is not enable”,Table or view not found

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

云原生大数据计算服务 MaxComputespark相关内容

云原生大数据计算服务 MaxCompute更多spark相关

云原生大数据计算服务 MaxCompute您可能感兴趣

产品推荐

阿里巴巴大数据计算

阿里大数据官方技术圈

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问