阿里云文档 2025-03-21

使用Hadoop命令操作OSS/OSS-HDFS

在使用阿里云EMR Serverless Spark的Notebook时,您可以通过Hadoop命令直接访问OSS或OSS-HDFS数据源。本文将详细介绍如何通过Hadoop命令操作OSS/OSS-HDFS。

阿里云文档 2025-02-14

基于自建Hadoop集群进行自定义CDH镜像

本文为您介绍如何在DataWorks绑定自建 Hadoop 集群并进行任务开发,以及如何自定义自建集群运行环境。

阿里云文档 2025-01-23

与自建集群的对比优势

与自建Hadoop集群相比,开源大数据开发平台EMR提供弹性资源管理和自动化运维,降低运维复杂度,通过用户管理、数据加密和权限管理等为数据安全保驾护航,同时EMR集成了丰富的开源组件并打通开源生态与阿里云生态,便于快速搭建大数据处理和分析场景。

阿里云文档 2024-12-30

基于Hadoop集群支持Delta Lake或Hudi存储机制

Delta Lake和Hudi是数据湖方案中常用的存储机制,为数据湖提供流处理、批处理能力。MaxCompute基于开源的Hadoop集群提供了支持Delta或Hudi存储机制的湖仓一体架构。您可以通过MaxCompute查询到实时数据,即时洞察业务数据变化。

问答 2024-07-24 来自:开发者社区

大数据计算MaxCompute3.1.1 对hadoop安装的版本有没有特殊要求?

大数据计算MaxCompute3.1.1 对hadoop安装的版本有没有特殊要求?

文章 2024-06-12 来自:开发者社区

【大数据】Hadoop下载安装及伪分布式集群搭建教程

1.概述 hadoop有三种安装模式 单机模式,只在一台机器上运行,存储用的本地文件系统而不是HDFS。 伪分布式模式,存储采用HDFS,名称节点和数据节点在同一台机器上。 分布式模式,标准的分布式集群。 做实验或者学习阶段选择伪分布式就好,本文将详细讲解在Linux搭建起一个伪分布式的hadoop集群。 2.环境准备 ...

【大数据】Hadoop下载安装及伪分布式集群搭建教程
文章 2024-04-24 来自:开发者社区

[大数据] mac 史上最简单 hadoop 安装过程

使用 brew 安装hadoop brew install brew ...

[大数据] mac 史上最简单 hadoop 安装过程
阿里云文档 2024-04-03

迁移Hadoop集群至DataLake集群

本文将详细阐述如何将您已有的旧版数据湖集群(Hadoop),高效地迁移至数据湖集群(DataLake),以下分别简称“旧集群”和“新集群”。迁移过程将充分考虑旧集群的版本、元数据类型以及存储方式,并针对这些因素,提供适应新集群的迁移策略与步骤。

文章 2023-12-20 来自:开发者社区

【大数据技术Hadoop+Spark】Flume、Kafka的简介及安装(图文解释 超详细)

Flume简介Flume是Cloudera提供的一个高可用、高可靠、分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。Flume主要由3个重要的组件构成:1)Source:完成对日志数据的收集,分成transtion 和 event 打入到channel之中。2)Cha....

【大数据技术Hadoop+Spark】Flume、Kafka的简介及安装(图文解释 超详细)
文章 2023-10-13 来自:开发者社区

【大数据开发技术】实验01-Hadoop安装部署

Hadoop安装部署虚拟机数量:3系统版本:Centos 7.5Hadoop版本: Apache Hadoop 2.7.3主节点信息:操作系统:CentOS7.5软件包位置:/home/zkpk/tgz数据包位置:/home/zkpk/experiment从节点信息:操作系统:CentOS7.5软件包位置:/home/zkpk/tgz数据包位置:/home/zkpk/experiment从节点信....

【大数据开发技术】实验01-Hadoop安装部署

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

大数据

大数据计算实践乐园,近距离学习前沿技术

+关注