文章 2022-02-17 来自:开发者社区

Hadoop源码分类概要整理

  最近突然觉得, 很多掌握的都还是很浅的原理,需要更深入细粒度去了解整个分布式系统的运转机制。于是。。开始作死而又作死而又作死的源码之旅。   Hadoop包的功能总共有下列几类:   tool:提供一些命令行工具,如DistCp,archive   mapreduce,:Hadoop的Map/Reduce实现   filecache:提供HDFS文件的本地缓存,用于加快Map/Reduce的....

文章 2022-02-15 来自:开发者社区

【Hadoop Summit Tokyo 2016】企业数据分类和治理

本讲义出自Shwetha Shivalingamurthy与Suma Shivaprasad在Hadoop Summit Tokyo 2016上的演讲,主要分享了企业数据分类和治理的案例并且深入地讲解了大数据治理的相关内容,并介绍了Atlas的概览和架构设计以及其特性和发展路线。

文章 2022-02-15 来自:开发者社区

Hadoop2.6.0的事件分类与实现

前言 说实在的,在阅读Hadoop YARN的源码之前,我对于java枚举的使用相形见绌。YARN中实现的事件在可读性、可维护性、可扩展性方面的工作都值得借鉴。 概念 在具体分析源码之前,我们先看看YARN是如何定义一个事件的。比如作业启动的事件,很多人可能会用常量将它定义到一个class文件中,就像下面这样: class Constants { public static final St...

问答 2022-02-15 来自:开发者社区

如果对Hadoop生态圈技术进行分类可以分为哪些类别?

如果对Hadoop生态圈技术进行分类可以分为哪些类别?

问答 2022-02-15 来自:开发者社区

在hadoop中如何设置全排序分类区?

在hadoop中如何设置全排序分类区?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

大数据

大数据计算实践乐园,近距离学习前沿技术

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等