阿里云文档 2025-06-05

使用Hadoop命令操作OSS/OSS-HDFS

在使用阿里云EMR Serverless Spark的Notebook时,您可以通过Hadoop命令直接访问OSS或OSS-HDFS数据源。本文将详细介绍如何通过Hadoop命令操作OSS/OSS-HDFS。

阿里云文档 2025-04-07

Spark作业读写OSS数据

本文以Spark自带的PageRank作业为例,介绍如何在ACK集群中运行Spark作业,并配置读写位于阿里云OSS(对象存储服务)中的数据。

文章 2025-02-28 来自:开发者社区

基于阿里云 EMR Serverless Spark 版快速搭建OSS日志分析应用

背       景 随着互联网服务的广泛普及与技术应用的深入发展,日志数据作为记录系统活动、用户行为和业务操作的宝贵资源,其价值愈发凸显。然而,当前海量日志数据的产生速度已经远远超出了传统数据分析工具的处理能力,这不仅要求我们具备高效的数据收集和存储机制,更呼唤着强大、灵活且易用的数据分析平台的诞生。在此背景下,Apache  Spark,这一专为...

基于阿里云 EMR Serverless Spark 版快速搭建OSS日志分析应用
文章 2024-11-05 来自:开发者社区

阿里云MaxCompute-XGBoost on Spark 极限梯度提升算法的分布式训练与模型持久化oss的实现与代码浅析

1. XGBoost简介 XGBoost是一个优化的分布式梯度增强库,旨在实现高效,灵活和便携。它在GBDT框架的基础上实现机器学习算法。XGBoost提供了并行树提升(也称为GBDT,GBM),可以快速准确地解决许多数据科学问题。XGBoost最初是一个研究项目,孵化于Distributed (Deep) Machine Learning Community (DMLC) ,由陈天奇博...

阿里云MaxCompute-XGBoost on Spark 极限梯度提升算法的分布式训练与模型持久化oss的实现与代码浅析
问答 2024-07-29 来自:开发者社区

spark 写入oss-hdfs任务,spark客户端一直在等待,如何解决?

spark 写入oss-hdfs任务,spark任务结束很久yarn任务也获取到成功,但是spark客户端一直在等待,如何解决?

问答 2024-07-10 来自:开发者社区

云数据仓库ADB Spark SQL访问OSS外表-(可选)步骤五:删除外表

云数据仓库ADB Spark SQL访问OSS外表-(可选)步骤五:删除外表

文章 2024-06-23 来自:开发者社区

MaxCompute操作报错合集之在Spark访问OSS时出现证书错误的问题,该如何解决

问题一:大数据计算MaxCompute 这个正常吗? 大数据计算MaxCompute 这个正常吗? https://dataworks.data.aliyun.com/ap-southeast-1/workbench?defa...

MaxCompute操作报错合集之在Spark访问OSS时出现证书错误的问题,该如何解决
问答 2024-06-15 来自:开发者社区

Maxcompute spark访问oss对象存储是否可以走ENI方式

Maxcompute spark访问oss对象存储是否可以走ENI方式

问答 2024-06-10 来自:开发者社区

DMS任务编排跨库Spark SQL节点是否支持将数据导出到OSS单个文件

DMS任务编排跨库Spark SQL节点是否支持将数据导出到OSS单个文件

问答 2024-05-29 来自:开发者社区

MaxComopute如何处理spark读ossWARN oss: [Client]Unabl...

MaxComopute如何处理spark读ossWARN oss: [Client]Unable to execute HTTP request: ConnectionTimeout报错

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

对象存储OSS

对象存储 OSS 是一款安全、稳定、高性价比、高性能的云存储服务,可以帮助各行业的客户在互联网应用、大数据分析、机器学习、数据归档等各种使用场景存储任意数量的数据,以及进行任意位置的访问,同时通过丰富的数据处理能力更便捷地使用数据。

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问