文章 2024-01-19 来自:开发者社区

Spark的核心概念:RDD、DataFrame和Dataset

Apache Spark,其核心概念包括RDD(Resilient Distributed Dataset)、DataFrame和Dataset。这些概念构成了Spark的基础,可以以不同的方式操作和处理数据,根据需求选择适当的抽象。 RDD(Resilient Distributed Dataset) RDD是Spark的基本数据抽象,它代表一个不可变、分布式的数据集合。下面我们将更详细地...

Spark的核心概念:RDD、DataFrame和Dataset
问答 2021-12-05 来自:开发者社区

Hadoop中Spark核心概念是什么?

Hadoop中Spark核心概念是什么?

问答 2020-12-28 来自:开发者社区

Spark on k8s的核心概念是什么?

Spark on k8s的核心概念是什么? 求大佬解答

文章 2017-09-01 来自:开发者社区

《Spark与Hadoop大数据分析》——3.2 学习Spark的核心概念

3.2 学习Spark的核心概念 在本节,我们要了解 Spark 的核心概念。Spark 提供的主要抽象是弹性分布式数据集(Resilient Distributed Dataset,RDD)。因此,我们要了解 RDD 是什么,以及提供内存级性能和容错的 RDD 中包含的运算。但是,首先我们要学习使用 Spark 的方法。 3.2.1 使用 Spark 的方法 使用 Spark 有两种方法,即 ....

文章 2017-07-03 来自:开发者社区

《Spark与Hadoop大数据分析》一一3.2 学习Spark的核心概念

本节书摘来自华章计算机《Spark与Hadoop大数据分析》一书中的第3章,第3.2节,作者:文卡特·安卡姆(Venkat Ankam) 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.2 学习Spark的核心概念 在本节,我们要了解 Spark 的核心概念。Spark 提供的主要抽象是弹性分布式数据集(Resilient Distributed Dataset,RDD)。因此,我们....

文章 2017-05-19 来自:开发者社区

《Spark大数据分析:核心概念、技术及实践》导读

Contents  目  录 译者序 前言 致谢 第1章 大数据技术一览 1.1 Hadoop 1.1.1 HDFS 1.1.2 MapReduce 1.1.3 Hive 1.2 数据序列化 1.2.1 Avro 1.2.2 Thrift 1.2.3 Protocol Buffers 1.2.4 SequenceFile 1.3 列存储 1.3.1 RCFile 1.3.2 ORC 1....

文章 2017-05-19 来自:开发者社区

《Spark大数据分析:核心概念、技术及实践》Spark Core

本节书摘来自华章出版社《Spark大数据分析:核心概念、技术及实践》一书中的第1章,第节,作者穆罕默德·古勒(Mohammed Guller)更多章节内容可以访问云栖社区“华章计算机”公众号查看。 Spark Core Spark是大数据领域最活跃的开源项目,甚至比Hadoop还要热门。如第1章所述,它被认为是Hadoop的继任者。Spark的使用率大幅增长。很多组织正在用Spark取代H...

文章 2017-05-19 来自:开发者社区

《Spark大数据分析:核心概念、技术及实践》Scala编程

本节书摘来自华章出版社《Spark大数据分析:核心概念、技术及实践》一书中的第1章,第2节,作者穆罕默德·古勒(Mohammed Guller)更多章节内容可以访问云栖社区“华章计算机”公众号查看。 Scala编程 Scala是当前热门的现代编程语言之一。它是编程语言界的凯迪拉克。它是一门强大且优美的语言。学会了它,对你的职业生涯大有裨益。 用不同的编程语言都可以编写大数据应用程序,比如Jav.....

文章 2017-05-19 来自:开发者社区

《Spark大数据分析:核心概念、技术及实践》大数据技术一览

本节书摘来自华章出版社《Spark大数据分析:核心概念、技术及实践》一书中的第1章,第1节,作者穆罕默德·古勒(Mohammed Guller)更多章节内容可以访问云栖社区“华章计算机”公众号查看。 大数据技术一览 我们正处在大数据时代。数据不仅是任何组织的命脉,而且在指数级增长。今天所产生的数据比过去几年所产生的数据大好几个数量级。挑战在于如何从数据中获取商业价值。这就是大数据相关技术想要解.....

文章 2017-05-02 来自:开发者社区

《Spark大数据分析:核心概念、技术及实践》一导读

前  言  Preface 本书是大数据和Spark方面的一本简明易懂的手册。它将助你学习如何用Spark来完成很多大数据分析任务。它覆盖了高效利用Spark所需要知道的一切内容。 购买本书的好处之一就是:帮你高效学习Spark,节省你大量时间。本书所覆盖的主题在互联网上都可以找到,网上有很多关于Spark的博客、PPT和视频。事实上,Spark的资料浩如烟海,你可能需要在网络上不同地方...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注