阿里云文档 2025-05-19

通过Spark SQL读写C-Store数据

云原生数据仓库 AnalyticDB MySQL 版集群支持通过Spark SQL在线或离线读写C-Store表(即表引擎是XUANWU的表)数据。本文主要介绍通过Spark SQL在线或离线读写C-Store表数据的具体方法。

文章 2024-06-07 来自:开发者社区

离线数仓(五)【数据仓库建模】(4)

离线数仓(五)【数据仓库建模】(3)https://developer.aliyun.com/article/1532392 我们把上面所有的派生指标拿出来分析: ...

文章 2024-06-07 来自:开发者社区

离线数仓(五)【数据仓库建模】(3)

离线数仓(五)【数据仓库建模】(2)https://developer.aliyun.com/article/1532390 5.2.4 明确统计指标        明确统计指标具体的工作是,深入分析需求(深入了解每个业务过程每个指标的运算逻辑),构建指标体系。构建指标体系的主要意义就是指标定义标准化。所有指标的定义,都必须遵循同一套标准...

离线数仓(五)【数据仓库建模】(3)
文章 2024-06-07 来自:开发者社区

离线数仓(五)【数据仓库建模】(2)

离线数仓(五)【数据仓库建模】(1)https://developer.aliyun.com/article/1532389 第5章 数据仓库设计 5.1 数据仓库分层规划        优秀可靠的数仓体系,需要良好的数据分层结构。合理的分层,能够使数据体系更加清晰,使复杂问题得以简化。以下是该项目的分层规划。 ...

离线数仓(五)【数据仓库建模】(2)
文章 2024-06-07 来自:开发者社区

离线数仓(五)【数据仓库建模】(1)

前言        今天开始正式数据仓库的内容了, 前面我们把生产数据 , 数据上传到 HDFS , Kafka 的通道都已经搭建完毕了, 数据也就正式进入数据仓库了, 解下来的数仓建模是重中之重 , 是将来吃饭的家伙 ! 以及 Hive SQL 必须熟练到像喝水一样 ! 第1章 数据仓库概述 1.1 数据仓库概念 &n...

离线数仓(五)【数据仓库建模】(1)
文章 2024-05-11 来自:开发者社区

从离线到实时:无锡锡商银行基于 Apache Doris 的数据仓库演进实践

2023 年 3 月,在阿里云瑶池数据库峰会上,阿里云与飞轮科技正式达成战略合作协议,双方旨在共同研发名为“阿里云数据库 SelectDB 版”的新一代实时数据仓库,为用户提供在阿里云上的全托管服务。SelectDB 是飞轮科技基于 Apache Doris 内核打造的聚焦于企业大数据实时分析需求的企业级产品。因此阿里云数据库 SelectDB 版也延续了 Apache Doris 性能优异、架....

从离线到实时:无锡锡商银行基于 Apache Doris 的数据仓库演进实践
文章 2024-01-29 来自:开发者社区

离线数据仓库规范

研发流程:开发设计流程数据建模流程数据标准和数据规范命名规范化工具词根设计定义把可能会多次用到的短语,集中命名,保证全局范围内的命名含义一致性。内容所属分类名称英文简称数据类型备注分类普通词根:描述事物的最小单元体,如:交易-trade。专有词根:具备约定成俗或行业专属的描述体,如:美元-USD。公共字段公共字段=词根组合+其它关键词公共字段放入词根库不太严谨,但字段命名时候可以直接取用,降低了....

离线数据仓库规范
阿里云文档 2024-01-23

如何批量新增离线数据同步任务_云原生数据仓库 AnalyticDB PostgreSQL版(AnalyticDB for PostgreSQL)

数据同步支持离线同步任务的批量创建,并支持一键启动多个上云任务,实现全量任务自动建表。本文以同步MySQL数据源到MaxCompute目标端为例,介绍如何批量新增离线数据同步任务。

文章 2024-01-18 来自:开发者社区

离线数仓6.0--- 数据仓库 ER模型-范式理论,维度模型、维度建模理论之事实表、维度建模理论之维度表

这是本人的学习过程,看到的同道中人祝福你们心若有所向往,何惧道阻且长;但愿每一个人都像星星一样安详而从容的,不断沿着既定的目标走完自己的路程,一起做星光下的赶路人;最后想说一句君子不隐其短,不知则问,不能则学。如果大家觉得我写的还不错的话希望可以收获关注、点赞、收藏(谢谢大家)1.1 ER模型缺点ER模型不适合数据仓库的建模操作,ER模型在创建的时候强调我们在分析问题是如何构建对象,如何构建对象....

离线数仓6.0--- 数据仓库 ER模型-范式理论,维度模型、维度建模理论之事实表、维度建模理论之维度表
文章 2024-01-16 来自:开发者社区

离线数仓6.0--- 数据仓库概述

1.1 数据仓库概念数据仓库是一个为数据分析而设计的企业级数据管理系统。数据仓库可集中、整合多个信息源的大量数据,借助数据仓库的分析能力,企业可从数据中获得宝贵的信息进而改进决策。同时,随着时间的推移,数据仓库中积累的大量历史数据对于数据科学家和业务分析师也是十分宝贵的。1.2 数据仓库核心架构Spark计算过程中,存在shuffle的操作,而shuffle会将计算过程一分为二,分为2个阶段(S....

离线数仓6.0--- 数据仓库概述

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

实时数仓Hologres

Hologres是一站式实时数据仓库引擎,支持海量数据实时写入、实时更新、实时分析,支持标准SQL(兼容PostgreSQL协议),支持PB级数据多维分析(OLAP)与即席分析(Ad Hoc),支持高并发低延迟的在线数据服务(Serving),与MaxCompute、Flink、DataWorks深度融合,提供离在线一体化全栈数仓解决方案。欢迎加入钉群:实时数仓Hologres交流群32314975

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问