阿里云文档 2025-04-29

基于MaxCompute创建面向Hologres的元数据映射和数据同步实践

本文为您介绍如何基于MaxCompute创建面向Hologres的元数据映射和数据同步。

阿里云文档 2025-02-25

Node Labels调度实践

Node Labels是YARN提供的节点分区功能,使得YARN在调度时能够在物理层面上对不同类型的作业进行有效隔离。本文为您介绍如何根据您的业务类型和节点类型创建相应的Node Labels。

阿里云文档 2024-09-18

MaxCompute近实时数仓数据入仓介绍

为满足业务对数据仓库中高度时效性数据的需求,MaxCompute基于Delta Table实现了分钟级近实时数据写入和主键更新功能,显著提升了数据仓库的数据更新效率。

阿里云文档 2024-05-16

镜像管理场景实践

MaxCompute提供用户自定义函数(UDF)及Python(PyODPS和MaxFrame)开发能力,本文为您介绍如何在MaxCompute UDF、PyODPS及MaxFrame作业开发中使用镜像。

文章 2024-05-11 来自:开发者社区

利用大数据优化业务流程:策略与实践

随着信息技术的飞速发展,大数据已经成为企业优化业务流程、提升竞争力的关键资源。通过深入挖掘和分析大数据,企业可以洞察市场趋势、了解客户需求、优化产品设计和改进服务流程,从而在激烈的市场竞争中脱颖而出。本文将探讨如何利用大数据优化业务流程的策略与实践。 一、大数据与业务流程优化的关系 在业务流程优化中,大数据发挥着至关重要的作用。大数据不仅可...

文章 2024-02-19 来自:开发者社区

利用大数据和API优化电商决策:商品性能分析实践

一、确定分析目标与规划数据收集 首先,明确分析目标是成功的第一步。我们需要知道我们想要解决的具体问题:是提高转化率、降低库存成本还是提升顾客满意度?一旦目标确定,我们就需要规划相应的数据收集工作。这包括销售数据、顾客反馈、价格变动等关键指标。 二、选择合适的API工具 淘宝、天猫等电商平台的API是我们获取商品数据的有力工具。这些API允许我们访问到商品的详细信息、用户评...

文章 2022-06-14 来自:开发者社区

《离线和实时大数据开发实战》(五)Hive 优化实践2

五、大表 Join 大表优化如果上述 mapjoin 中小表 dim_seller 很大呢?比如超过了 1GB 的大小?这种就是大表join 大表的问题 。这类问题相对比较复杂,我们首先引入具体的问题场景,然后基于此介绍各种优化方案。5.1 问题场景我们先假设一个问题场景:A 表为一个汇总表,汇总的是卖家买家最近 N 天交易汇总信息,即对于每个卖家最近 N 天,其每个买家共成交了多少单、总金额是....

《离线和实时大数据开发实战》(五)Hive 优化实践2
文章 2022-06-14 来自:开发者社区

《离线和实时大数据开发实战》(五)Hive 优化实践1

文章目录前言一、离线数据的主要挑战:“数据倾斜”二、Hive 的优化三、Join 无关的优化3.1 group by 引起的倾斜优化3.2 count distinct 优化四、大表 Join 小表优化五、大表 Join 大表优化5.1 问题场景方案 1:转化为 mapjoin方案 2:join 时用 case when 语句方案 3:倍数B表,再取模join方案 4:动态一分为二前言前面,我们....

《离线和实时大数据开发实战》(五)Hive 优化实践1

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

云原生大数据计算服务 MaxCompute实践相关内容

云原生大数据计算服务 MaxCompute更多实践相关

云原生大数据计算服务 MaxCompute您可能感兴趣

产品推荐

阿里巴巴大数据计算

阿里大数据官方技术圈

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问