阿里云文档 2024-11-13

DataWorks中EMR Serverless Spark版本的用户画像分析的加工数据阶段

本文为您介绍如何用Spark SQL创建外部用户信息表ods_user_info_d_spark以及日志信息表ods_raw_log_d_spark访问存储在私有OSS中的用户与日志数据,通过DataWorks的EMR Spark SQL节点进行加工得到目标用户画像数据,阅读本文后,您可以了解如何通过Spark SQL来计算和分析已同步的数据,完成数仓简单数据加工场景。

阿里云文档 2024-09-23

在TDX实例中基于BigDL PPML构建全链路安全的分布式Spark大数据分析应用

本文介绍在基于Intel® TDX安全特性的g8i实例中,使用BigDL PPML解决方案运行分布式的全链路安全的Spark大数据分析应用。

文章 2024-05-02 来自:开发者社区

Spark是一个基于内存的通用数据处理引擎,可以进行大规模数据处理和分析

Spark是一个基于内存的通用数据处理引擎,可以进行大规模数据处理和分析。它提供了高效的数据存储、处理和分析功能,支持多种编程语言和数据源,包括Hadoop、Cassandra、HBase等。 Spark具有以下特点: 高效性:Spark使用内存计算技术,可以快速地进行数据处理和分析,比传统的磁盘读写方式更加高效。 易用性:Spark提供了简洁的API和丰富的库,可以方便地进行数据处...

Spark是一个基于内存的通用数据处理引擎,可以进行大规模数据处理和分析
文章 2017-02-19 来自:开发者社区

【Spark Summit East 2017】Ernest:基于Spark的性能预测大规模分析框架

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data;此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步,详情访问https://www.aliyun.com/product/odps。 本讲义出自Shivaram Venkataraman在Spark Summit East 2017上的演讲,近期使用Spark进行机器学习,基因组学.....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!

+关注