apache spark大数据分析的相关内容

文章 2017-05-02 来自：开发者社区

《Spark大数据分析：核心概念、技术及实践》一第2章 Scala编程

本节书摘来自华章出版社《Spark大数据分析：核心概念、技术及实践》一书中的第2章，第2.1节，作者[美]　穆罕默德·古勒（Mohammed Guller），更多章节内容可以访问云栖社区“华章计算机”公众号查看。第2章 Scala编程 Scala是当前热门的现代编程语言之一。它是编程语言界的凯迪拉克。它是一门强大且优美的语言。学会了它，对你的职业生涯大有裨益。用不同的编...

文章 2017-05-02 来自：开发者社区

《Spark大数据分析：核心概念、技术及实践》一1.7　总结

本节书摘来自华章出版社《Spark大数据分析：核心概念、技术及实践》一书中的第1章，第1.7节，作者[美]　穆罕默德·古勒（Mohammed Guller），更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.7　总结近年来数据的指数级增长给许多大数据技术带来了机会。传统的专有产品要么无法处理大数据，要么代价太昂贵。这就为开源大数据技术打开了一扇门。仅仅在过去几年...

文章 2017-05-02 来自：开发者社区

《Spark大数据分析：核心概念、技术及实践》一1.6　分布式SQL查询引擎

本节书摘来自华章出版社《Spark大数据分析：核心概念、技术及实践》一书中的第1章，第1.6节，作者[美]　穆罕默德·古勒（Mohammed Guller），更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.6　分布式SQL查询引擎如前所述，SQL是最常用来查询和分析数据的语言之一。它易学且有群众基础（了解SQL的人远比了解编程语言如Java的人多）。基本上，H...

文章 2017-05-02 来自：开发者社区

《Spark大数据分析：核心概念、技术及实践》一1.5　NoSQL

本节书摘来自华章出版社《Spark大数据分析：核心概念、技术及实践》一书中的第1章，第1.5节，作者[美]　穆罕默德·古勒（Mohammed Guller），更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.5　NoSQL NoSQL这个术语用于非关系型的现代数据库。起初，NoSQL指的是“不支持SQL”，因为这些数据库不支持SQL。而现在，它指的是“不止SQL”...

文章 2017-05-02 来自：开发者社区

《Spark大数据分析：核心概念、技术及实践》一1.4　消息系统

本节书摘来自华章出版社《Spark大数据分析：核心概念、技术及实践》一书中的第1章，第1.4节，作者[美]　穆罕默德·古勒（Mohammed Guller），更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.4　消息系统数据通常从一个应用流向另一个。一个应用产生数据，而后被一个或多个其他应用使用。一般来讲，生成或发送数据的应用叫作生产者，接收数据的则叫作消费者。...

文章 2017-05-02 来自：开发者社区

《Spark大数据分析实战》——1.3节Spark架构与运行逻辑

本节书摘来自华章社区《Spark大数据分析实战》一书中的第1章，第1.3节Spark架构与运行逻辑，作者高彦杰　倪亚宇，更多章节内容可以访问云栖社区“华章社区”公众号查看 1.3　Spark架构与运行逻辑1.?Spark的架构Driver：运行Application的main()函数并且创建SparkContext。Client：用户提交作业的客户端。Worker：集群中任何可以运行Applic....

文章 2017-05-02 来自：开发者社区

《Spark大数据分析实战》——1.2节Spark生态系统BDAS

本节书摘来自华章社区《Spark大数据分析实战》一书中的第1章，第1.2节Spark生态系统BDAS，作者高彦杰　倪亚宇，更多章节内容可以访问云栖社区“华章社区”公众号查看 1.2　Spark生态系统BDAS目前，Spark已经发展成为包含众多子项目的大数据计算平台。BDAS是伯克利大学提出的基于Spark的数据分析栈（BDAS）。其核心框架是Spark，同时涵盖支持结构化数据SQL查询与分析的....

文章 2017-05-02 来自：开发者社区

《Spark大数据分析：核心概念、技术及实践》一 1.3　列存储

本节书摘来自华章出版社《Spark大数据分析：核心概念、技术及实践》一书中的第1章，第1.3节，作者[美]　穆罕默德·古勒（Mohammed Guller），更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.3　列存储数据可以面向行或面向列的格式来存储。在面向行格式中，一行的所有列或字段存储在一起。这里的一行，可以是CSV文件中的一行，或者是数据库表中的一条记录...

文章 2017-05-02 来自：开发者社区

《Spark大数据分析：核心概念、技术及实践》一1.2　数据序列化

本节书摘来自华章出版社《Spark大数据分析：核心概念、技术及实践》一书中的第1章，第1.2节，作者[美]　穆罕默德·古勒（Mohammed Guller），更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.2　数据序列化数据有自己的生命周期，独立于创建或使用它的程序。大多数情况下，数据比创建它的应用存活得更久。一般来说，数据保存在硬盘上。有时，也会通过网络把数...

文章 2017-05-02 来自：开发者社区

《Spark大数据分析实战》——1.1节初识Spark

本节书摘来自华章社区《Spark大数据分析实战》一书中的第1章，第1.1节初识Spark，作者高彦杰　倪亚宇，更多章节内容可以访问云栖社区“华章社区”公众号查看 1.1　初识SparkSpark是基于内存计算的大数据并行计算框架，因为它基于内存计算，所以提高了在大数据环境下数据处理的实时性，同时保证了高容错性和高可伸缩性，允许用户将Spark部署在大量廉价硬件之上，形成集群。1.?Spark执行....

共有115条

< 1 ... 8 9 10 11 12 >

跳转至： GO

更新时间 2024-08-08 15:30:43

本页面内关键词为智能算法引擎基于机器学习所生成，如有任何问题，可在页面下方点击"联系我们"与我们沟通。

apache spark更多大数据分析相关

apache spark您可能感兴趣

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区，定期推送精彩案例，问答区数个 Spark 技术同学每日在线答疑，只为营造 Spark 技术交流氛围，欢迎加入！

+关注