阿里云文档 2024-06-19

零售电子商务数仓搭建数据治理

任务开发上线之后,数据正在稳定生产中,您需要对对应的业务表通过可视化查看、自动的数据质量监控、敏感数据管理等多种不同方式进行治理,而以下这些模块就可以很好的帮助您对数据进行治理。

文章 2024-05-29 来自:开发者社区

大数据平台治理——运营的角度看数仓

前言 三分靠技术,七分靠管理,其实一直就是技术岗位的现状,事实上在一个完整的互联网产业结构中,除了本身的软件性能和软件设计的优雅追求,还有着业务的持续运营以及背后的商业模式的运作。分析师的工作更多的就是指导业务的运营以及商业上成本的考量,以便为进一步的决策提供数据参考,本文就从一个数据分析师的角度去聊一下数仓的治理。 分析框架 开局一张图 ...

大数据平台治理——运营的角度看数仓
文章 2024-05-29 来自:开发者社区

闲侃数仓优化-大数据治理和优化

前言 写标题的时候是2021-07-04 22:22,在那之前我以前一直是想琢磨怎么去扯数仓优化这玩意好点,总是觉得应该来个万字长文啥的才写下来,现在不那样折腾了,想到啥就写点啥,大不了未来再多搞几篇就是了。 为啥数仓需要优化 这个问题其实在不同的人看是不一样的 ...

文章 2023-06-18 来自:开发者社区

Hive 数仓数据质量治理

1. 数据质量概述数据质量是数据创建价值的保障基石,高质量的数据为数据统计、分析和应用提供了可信任的必要条件。数据质量管理是指在数据创建、加工、使用和迁移等过程中,通过开展数据质量定义、过程控制、监控、问题分析和整改、评估和考核等一系列管理活动,提高数据质量以满足业务要求。可按照"谁创建,谁负责;谁加工,谁负责;谁提供,谁负责"的原则界定数据质量管理责任,由数据流转环节的各责任方对管辖范围内的数....

文章 2023-05-26 来自:开发者社区

《全链路数据治理-智能数据建模 》——数仓建模理论与规范(1)

数仓建模理论与规范作者:渠振方,大数据售前专家服务团队摘要:本文主要介绍数据仓库模型架构设计的目标、核心思想和核心步骤。一、 模型架构设计目标1. 数据仓库的定义数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making ....

《全链路数据治理-智能数据建模 》——数仓建模理论与规范(1)
文章 2023-05-26 来自:开发者社区

《全链路数据治理-智能数据建模 》——数仓建模理论与规范(2)

《全链路数据治理-智能数据建模 》——数仓建模理论与规范(1) https://developer.aliyun.com/article/1231086?groupCode=tech_library二、 模型架构设计核心思想1. 核心原则模型架构设计的核心原则是高内聚、低耦合,即在域内内聚,域之间耦合,以及业务和模型的耦合,在此之上实现稳定性、扩展性、建设效率、产出效率和使用效率。2. 核心过程....

《全链路数据治理-智能数据建模 》——数仓建模理论与规范(2)
文章 2023-05-26 来自:开发者社区

《全链路数据治理-智能数据建模 》——数仓建模理论与规范(3)

《全链路数据治理-智能数据建模 》——数仓建模理论与规范(2) https://developer.aliyun.com/article/1231084?groupCode=tech_library五、 数据模型设计流程数据模型设计主要分为三个阶段:需求调研,规范定义,模型设计。1. 名词解释1) 时间周期用来明确数据统计的时间范围或者时间点,如最近30 天、自然周、截至当日等。2) 修饰词指除....

文章 2023-05-26 来自:开发者社区

《全链路数据治理-智能数据建模 》——数仓建模理论与规范(4)

《全链路数据治理-智能数据建模 》——数仓建模理论与规范(3) https://developer.aliyun.com/article/1231083?groupCode=tech_library2. 需求调研1) 业务调研业务调研的流程分三个步骤:• 输入调研模板。• 针对产品和运营进行调研。• 归纳产出:业务过程&数据域。下图举例说明业务调研的流程:2) 需求分析需求分析的三个步骤....

《全链路数据治理-智能数据建模 》——数仓建模理论与规范(4)
文章 2023-05-26 来自:开发者社区

《全链路数据治理-智能数据建模 》——数仓建模理论与规范(5)

《全链路数据治理-智能数据建模 》——数仓建模理论与规范(4) https://developer.aliyun.com/article/1231081?groupCode=tech_library3. 规范定义1) 一致性维度维度及维度属性在总线矩阵下,维度必须归属某一个数据域,维度属性的来源一种是源系统,一种是挖掘计算,如最近一次支付时间。特殊维度• 杂项维度:将事实表中的状态、分类等字段定....

《全链路数据治理-智能数据建模 》——数仓建模理论与规范(5)
文章 2023-05-26 来自:开发者社区

《全链路数据治理-智能数据建模 》——数仓建模理论与规范(6)

《全链路数据治理-智能数据建模 》——数仓建模理论与规范(5) https://developer.aliyun.com/article/1231080?groupCode=tech_library4. 模型设计1) 设计原则• 高内聚,低耦合• 规范性,一致性• 稳定性,可扩展• 公共逻辑下沉• 成本性,能平衡• 支持多次回刷2) 维度表设计设计流程基本原则• 缓慢变化维Kimball 的三种....

《全链路数据治理-智能数据建模 》——数仓建模理论与规范(6)

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

云原生数据仓库AnalyticDB MySQL版治理相关内容

产品推荐

数据仓库

阿里云自主研发的云原生数据仓库,具有高并发读写、低峰谷读写、弹性扩展、安全可靠等特性,可支持PB级别数据存储,可广泛应用于BI、机器学习、实时分析、数据挖掘等场景。包含AnalyticDB MySQL版、AnalyticDB PostgreSQL 版。

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等