阿里云文档 2025-03-21

使用Hadoop命令操作OSS/OSS-HDFS

在使用阿里云EMR Serverless Spark的Notebook时,您可以通过Hadoop命令直接访问OSS或OSS-HDFS数据源。本文将详细介绍如何通过Hadoop命令操作OSS/OSS-HDFS。

阿里云文档 2025-02-14

基于自建Hadoop集群进行自定义CDH镜像

本文为您介绍如何在DataWorks绑定自建 Hadoop 集群并进行任务开发,以及如何自定义自建集群运行环境。

阿里云文档 2025-01-23

与自建集群的对比优势

与自建Hadoop集群相比,开源大数据开发平台EMR提供弹性资源管理和自动化运维,降低运维复杂度,通过用户管理、数据加密和权限管理等为数据安全保驾护航,同时EMR集成了丰富的开源组件并打通开源生态与阿里云生态,便于快速搭建大数据处理和分析场景。

阿里云文档 2024-12-30

基于Hadoop集群支持Delta Lake或Hudi存储机制

Delta Lake和Hudi是数据湖方案中常用的存储机制,为数据湖提供流处理、批处理能力。MaxCompute基于开源的Hadoop集群提供了支持Delta或Hudi存储机制的湖仓一体架构。您可以通过MaxCompute查询到实时数据,即时洞察业务数据变化。

阿里云文档 2024-04-03

迁移Hadoop集群至DataLake集群

本文将详细阐述如何将您已有的旧版数据湖集群(Hadoop),高效地迁移至数据湖集群(DataLake),以下分别简称“旧集群”和“新集群”。迁移过程将充分考虑旧集群的版本、元数据类型以及存储方式,并针对这些因素,提供适应新集群的迁移策略与步骤。

文章 2022-02-17 来自:开发者社区

【小白视角】大数据基础实践(二)Hadoop环境搭建与测试

Hadoop环境的搭建与测试1.简介实验环境1.1基础知识1.2 特点1.3 生态系统1.3.1 HDFS1.3.2 YARN1.3.3 MapReduce1.3.4 Zookeeper1.3.5 HBase1.3.6 Hive1.3.7 Pig1.3.8 Mahout1.3.9 Sqoop1.3.10 Flume2. Hadoop 安装于环境配置2.1 解压Hadoop压缩包2.2 Hadoo....

【小白视角】大数据基础实践(二)Hadoop环境搭建与测试
文章 2022-02-17 来自:开发者社区

【小白视角】大数据基础实践(一)搭建Hadoop集群

大数据实践第一篇,面向小白编程搭建Hadoop集群大数据实践第一篇,面向小白编程Ubuntu的操作1.下载文件1.1下载ubuntu镜像文件1.2 下载及安装VMware1.3在VMware安装Ubuntu1.4安装VMware Tools工具2.安装必要配置2.1换源2.2 安装vim2.3 安装net-tools2.4 安装jdk1.82.4.1创建2.4.2配置环境2.5 open-ser....

【小白视角】大数据基础实践(一)搭建Hadoop集群
文章 2022-02-17 来自:开发者社区

阿里云ECS构建大数据平台实践-基于Apache Hadoop

0. 项目背景 基于阿里云ECS云服务器进行搭建私有的大数据平台,采用Apache Hadoop生态,为大数据提供存储及处理。 1. 购买ECS云服务器实例 在这里,因为实验需要3个节点,所以我们购买3台ECS实例。 2. 远程登录服务器,进行基础环境的配置。 # 工欲善其事,必先利其器 # 前提准备 # 安装系统命令 yum -y install wget vim ntpdate net-...

文章 2022-02-16 来自:开发者社区

《Hadoop与大数据挖掘》一2.2.5 动手实践:Hadoop IDE配置

本节书摘来华章计算机《Hadoop与大数据挖掘》一书中的第2章 ,第2.2.5节,张良均 樊 哲 位文超 刘名军 许国杰 周 龙 焦正升 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.2.5 动手实践:Hadoop IDE配置 在书中的后续内容中,会针对Hadoop相关MapReduce程序进行讲解以及开发,一个好的程序讲解及代码编写环境,将会非常有利于对应的分析,所以本节就对....

文章 2022-02-16 来自:开发者社区

《Hadoop与大数据挖掘》一2.2.4 动手实践:一键式Hadoop集群启动关闭

本节书摘来华章计算机《Hadoop与大数据挖掘》一书中的第2章 ,第2.2.4节,张良均 樊 哲 位文超 刘名军 许国杰 周 龙 焦正升 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.2.4 动手实践:一键式Hadoop集群启动关闭 在使用Hadoop的过程中,如果每次启动Hadoop集群都需要分别执行3次命令才能启动集群,那么每次集群启动或关闭都将很繁琐。为了减少这种操作,可....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

大数据

大数据计算实践乐园,近距离学习前沿技术

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等