apache spark大数据分析的相关内容

文章 2017-05-02 来自：开发者社区

《Spark大数据分析实战》——3.1节SQL on Spark

本节书摘来自华章社区《Spark大数据分析实战》一书中的第3章，第3.1节SQL on Spark，作者高彦杰　倪亚宇，更多章节内容可以访问云栖社区“华章社区”公众号查看 3.1　SQL on SparkAMPLab将大数据分析负载分为三大类型：批量数据处理、交互式查询、实时流处理。而其中很重要的一环便是交互式查询。大数据分析栈中需要满足用户ad-hoc、reporting、iterative等....

文章 2017-05-02 来自：开发者社区

《Spark大数据分析实战》——第3章BDAS简介

本节书摘来自华章社区《Spark大数据分析实战》一书中的第3章BDAS简介，作者高彦杰　倪亚宇，更多章节内容可以访问云栖社区“华章社区”公众号查看第3章BDAS简介提到Spark不得不说伯克利大学AMPLab开发的BDAS（Berkeley Data Analytics Stack）数据分析的软件栈，如图3-1所示是其中的Spark生态系统。其中用内存分布式大数据计算引擎Spark替代原有的M....

文章 2017-05-02 来自：开发者社区

《Spark大数据分析实战》——2.5节本章小结

本节书摘来自华章社区《Spark大数据分析实战》一书中的第2章，第2.5节本章小结，作者高彦杰　倪亚宇，更多章节内容可以访问云栖社区“华章社区”公众号查看 2.5　本章小结本章首先介绍了Spark应用程序的开发流程以及如何编译和调试Spark程序。用户可以选用对Scala项目能够很好支持的Intellij IDE。如果用户想深入了解Spark，以及诊断问题，建议读者配置好源码阅读环境，进行源码分....

文章 2017-05-02 来自：开发者社区

《Spark大数据分析实战》——2.4节配置Spark源码阅读环境

本节书摘来自华章社区《Spark大数据分析实战》一书中的第2章，第2.4节配置Spark源码阅读环境，作者高彦杰　倪亚宇，更多章节内容可以访问云栖社区“华章社区”公众号查看 2.4　配置Spark源码阅读环境由于Spark使用SBT作为项目管理构建工具，SBT的配置文件中配置了依赖的jar包网络路径，在编译或者生成指定类型项目时需要从网络下载jar包。需要用户预先安装git。在Linux操作系统....

文章 2017-05-02 来自：开发者社区

《Spark大数据分析实战》——2.3节Spark编译

本节书摘来自华章社区《Spark大数据分析实战》一书中的第2章，第2.3节Spark编译，作者高彦杰　倪亚宇，更多章节内容可以访问云栖社区“华章社区”公众号查看 2.3　Spark编译用户可以通过Spark的默认构建工具SBT进行源码的编译和打包。当用户需要对源码进行二次开发时，则需要对源码进行增量编译，通过下面的方式读者可以实现编译和增量编译。（1）克隆Spark源码可通过克隆的方式克隆Spa....

文章 2017-05-02 来自：开发者社区

《Spark大数据分析实战》——2.2节远程调试Spark程序

本节书摘来自华章社区《Spark大数据分析实战》一书中的第2章，第2.2节远程调试Spark程序，作者高彦杰　倪亚宇，更多章节内容可以访问云栖社区“华章社区”公众号查看 2.2　远程调试Spark程序本地调试Spark程序和传统的调试单机的Java程序基本一致，读者可以参照原来的方式进行调试，关于单机调试本书暂不赘述。对于远程调试服务器上的Spark代码，首先请确保在服务器和本地的Spark版本....

文章 2017-05-02 来自：开发者社区

《Spark大数据分析实战》——2.1节Spark应用开发环境配置

本节书摘来自华章社区《Spark大数据分析实战》一书中的第2章，第2.1节Spark应用开发环境配置，作者高彦杰　倪亚宇，更多章节内容可以访问云栖社区“华章社区”公众号查看 2.1　Spark应用开发环境配置Spark的开发可以通过Intellij或者Eclipse IDE进行，在环境配置的开始阶段，还需要安装相应的Scala插件。2.1.1　使用Intellij开发Spark程序本节介绍如何使....

文章 2017-05-02 来自：开发者社区

《Spark大数据分析实战》——第2章Spark开发与环境配置

本节书摘来自华章社区《Spark大数据分析实战》一书中的第2章Spark开发与环境配置，作者高彦杰　倪亚宇，更多章节内容可以访问云栖社区“华章社区”公众号查看第2章Spark开发与环境配置用户进行Spark应用程序开发，一般在用户本地进行单机开发调试，之后再将作业提交到集群生产环境中运行。下面将介绍Spark开发环境的配置，如何编译和进行源码阅读环境的配置。用户可以在官网上下载最新的AS软件包....

文章 2017-05-02 来自：开发者社区

《Spark大数据分析实战》——1.5节本章小结

本节书摘来自华章社区《Spark大数据分析实战》一书中的第1章，第1.5节本章小结，作者高彦杰　倪亚宇，更多章节内容可以访问云栖社区“华章社区”公众号查看 1.5　本章小结本章首先介绍了Spark分布式计算平台的基本概念、原理以及Spark生态系统BDAS之上的典型组件。Spark为用户提供了系统底层细节透明、编程接口简洁的分布式计算平台。Spark具有内存计算、实时性高、容错性好等突出特点。同....

文章 2017-05-02 来自：开发者社区

《Spark大数据分析实战》——1.4节弹性分布式数据集

本节书摘来自华章社区《Spark大数据分析实战》一书中的第1章，第1.4节弹性分布式数据集，作者高彦杰　倪亚宇，更多章节内容可以访问云栖社区“华章社区”公众号查看 1.4　弹性分布式数据集本节将介绍弹性分布式数据集RDD。Spark是一个分布式计算框架，而RDD是其对分布式内存数据的抽象，可以认为RDD就是Spark分布式算法的数据结构，而RDD之上的操作是Spark分布式算法的核心原语，由数据....

共有115条

< 1 ... 8 9 10 11 12 >

跳转至： GO

更新时间 2024-08-08 15:30:43

本页面内关键词为智能算法引擎基于机器学习所生成，如有任何问题，可在页面下方点击"联系我们"与我们沟通。

apache spark更多大数据分析相关

apache spark您可能感兴趣

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区，定期推送精彩案例，问答区数个 Spark 技术同学每日在线答疑，只为营造 Spark 技术交流氛围，欢迎加入！

+关注