文章 2019-06-17 来自:开发者社区

通过Spark SQL实时归档SLS数据

作者:木艮,阿里云E-MapReduce开发工程师 我在前一篇文章介绍过基于Spark SQL实现对HDFS操作的实时监控报警。今天,我再举例说明一下如何使用Spark SQL进行流式应用的开发。本文主要分成三部分: 流式计算和SQL 简要介绍Spark SQL流式开发语法 实时归档SLS数据到HDFS 1. 流式计算和SQL 数据的价值随着时间逐渐降低。及时尽早的对数据进行处理提升了数据的...

文章 2019-06-17 来自:开发者社区

通过Spark SQL实时归档SLS数据

我在前一篇文章介绍过基于Spark SQL实现对HDFS操作的实时监控报警。今天,我再举例说明一下如何使用Spark SQL进行流式应用的开发。本文主要分成三部分: 流式计算和SQL 简要介绍Spark SQL流式开发语法 实时归档SLS数据到HDFS 1. 流式计算和SQL 数据的价值随着时间逐渐降低。及时尽早的对数据进行处理提升了数据的价值,所以流式计算系统的应用也越来越广泛。目前常用的...

问答 2019-05-30 来自:开发者社区

spark Sql都是client模式,而有时driver需要较多的资源,多用户共享一台机器时,client物理机资源可能会成为瓶颈,这个你们有什么解决方案吗

spark Sql都是client模式,而有时driver需要较多的资源,多用户共享一台机器时,client物理机资源可能会成为瓶颈,这个你们有什么解决方案吗

问答 2019-05-16 来自:开发者社区

请教一下,spark sql 执行比如select * from table where day >='2018-05-04' 后面限定过滤后的具体partition访问 源码里是在哪个阶段哪个函数获取的

请教一下,spark sql 执行比如select * from table where day >='2018-05-04' 后面限定过滤后的具体partition访问 源码里是在哪个阶段哪个函数获取的

问答 2019-04-26 来自:开发者社区

Spark SQL连RDS出现“Invalid authorization specification, message from server: ip not in whitelist”

Spark SQL连RDS出现“Invalid authorization specification, message from server: ip not in whitelist”

问答 2019-04-26 来自:开发者社区

Spark SQL抛出“Exception in thread “main” java.sql.SQLException: No suitable driver found for jdbc:mysql:xxx”报错

Spark SQL抛出“Exception in thread “main” java.sql.SQLException: No suitable driver found for jdbc:mysql:xxx”报错

问答 2019-04-22 来自:开发者社区

如何通过Spark SQL连接BigQuery?

data = pd.read_gbq(SampleQuery, project_id='XXXXXXXX', private_key='filename.json')这里的filename.json具有以下格式:{ "type": "service_account", "project_id": "projectId", "private_key_id": "privateKeyId", ...

文章 2019-04-12 来自:开发者社区

基于Spark SQL实现对HDFS操作的实时监控报警

1.前言 E-MapReduce计划从EMR-3.18.1版本开始提供Spark Streaming SQL的预览版功能。Spark Streaming SQL是在Spark Structured Streaming的基础上做了进一步封装,方便用户使用SQL语言进行Spark流式分析开发。Spark Streaming SQL直接地透明地受惠于Spark SQL的优化带来的性能提升,同时也遵循S....

文章 2019-03-26 来自:开发者社区

Spark SQL玩起来

标签(空格分隔): Spark [toc] 前言 Spark SQL的介绍只包含官方文档的Getting Started、DataSource、Performance Tuning和Distributed SQL Engine部分。不含其他的迁移和PySpark等部分。 Spark SQL介绍 Spark SQL是一个Spark模块用于结构化数据处理。与基本的Spark RDD API不同,S.....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

数据库

分享数据库前沿,解构实战干货,推动数据库技术变革

+关注