阿里云文档 2025-01-24

基于Delta Table构建近实时增全量一体化链路实践

面对当前日益复杂且对数据时效性要求极高的近实时业务场景,MaxCompute基于Delta Table推出了集大规模存储、高效批量处理和近实时能力于一体的近实时增量一体化架构。本文为您介绍该架构的工作原理及其优势。

阿里云文档 2024-12-26

高并发近实时增量写入场景的架构设计的基本概念

数据流入Delta Table主要存在近实时增量写入和批量写入两种场景,本文为您介绍高并发近实时增量写入场景的架构设计。

阿里云文档 2024-06-07

EMR Serverless StarRocks产品架构介绍

本文为您介绍EMR Serverless StarRocks的架构。

阿里云文档 2024-06-04

如何在EMR-HBase集群将存算一体架构转换为存算分离架构

本文为您介绍对于EMR-HBase集群,如何将存算一体架构转换为存算分离架构。

文章 2023-10-12 来自:开发者社区

【大数据处理框架】Spark大数据处理框架,包括其底层原理、架构、编程模型、生态圈

Spark大数据处理框架是一个开源的大数据处理框架,它可提供高效的内存计算,可在弹性、分布式的集群上运行。Spark框架的优势在于它能够更加高效地利用计算资源,提高数据处理速度,因此在大数据处理领域中广受欢迎。Spark框架的底层原理Spark框架的底层原理基于RDD(Resilient Distributed Datasets)模型,它是Spark的核心概念之一。RDD是一种抽象的数据结构,可....

阿里云文档 2022-10-28

如何在HBaseonOSS架构下使用OSS作为HBase的底层存储

在EMR-5.6.0及以后版本和EMR-3.40.0及以后版本中使用HBase时,您可以存储HBase的数据在OSS上。本文为您介绍HBase on OSS架构,以及如何使用OSS作为HBase的底层存储。

文章 2019-11-26 来自:开发者社区

11月28日Spark社区直播【Tablestore结合Spark的云上流批一体大数据架构 】

议题: Tablestore结合Spark的云上流批一体大数据架构 直播间直达(回看)链接: https://developer.aliyun.com/live/1716 简介: 传统Lambda架构组件多运维复杂,如何使用一套存储和一套计算来实现流批架构充分享受技术红利?以Delta Lake为代表的新型数据湖方案越来越流行,传统的Lambda架构如何向数据湖架构进行扩展?以及结构化数据结合D....

11月28日Spark社区直播【Tablestore结合Spark的云上流批一体大数据架构 】
文章 2017-08-01 来自:开发者社区

如何设计基于Hadoop、Spark、Storm的大数据风控架构?

量化派是一家金融大数据公司,为金融机构提供数据服务和技术支持,也通过旗下产品“信用钱包”帮助个人用户展示经济财务等状况,撮合金融机构为用户提供最优质的贷款服务。金融的本质是风险和流动性,但是目前中国对于个人方面的征信行业发展落后于欧美国家,个人消费金融的需求没有得到很好的满足。按照央行最新数据,目前央行征信中心的数据覆盖人口达到8亿人[1],但其中有实际征信记录的只有3亿人左右,有5亿人在征信系....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

金融级分布式架构

SOFAStack™(Scalable Open Financial Architecture Stack)是一套用于快速构建金融级分布式架构的中间件,也是在金融场景里锤炼出来的最佳实践。

+关注
X