阿里云文档 2025-06-04

开放存储SDK示例-Python SDK

MaxCompute支持第三方引擎(如Spark on EMR、StarRocks、Presto、PAI和Hologres)通过SDK调用Storage API直接访问MaxCompute数据,本文为您介绍使用Python SDK访问MaxCompute的代码示例。

阿里云文档 2025-05-09

选择地域和存储

在阿里云EMR中,地域与存储直接影响集群的性能和成本。合理选择地域可降低网络延迟、满足数据本地化合规要求,并优化资源成本。科学的存储配置(如HDFS、OSS-HDFS/OSS)则能提升数据读写效率、降低存储成本,同时保障数据可靠性。本文将从地域选择和存储规划两个核心维度出发,提供策略与关键考量,帮助您快速选型。

阿里云文档 2025-04-11

MaxCompute同城容灾

MaxCompute同城容灾用于应对运营商网络故障、IDC停电、机房设施故障、集群故障等场景。通过开启多AZ存储容灾和多AZ计算高可用,可有效降低业务停机时间,满足业务保障需求和行业合规要求。

阿里云文档 2025-03-14

分层存储配置优化

MaxCompute支持通过设置表或分区的分层存储类型,降低数据存储费用。MaxCompute提供分层存储配置优化功能,可基于表的最近访问时间,根据默认策略或自定义策略评估当前地域是否有存储降本空间,辅助您进行分层存储策略配置。

阿里云文档 2025-03-07

开放存储SDK示例-Java SDK

MaxCompute支持第三方引擎(如Spark on EMR、StarRocks、Presto、PAI和Hologres)通过SDK调用Storage API直接访问MaxCompute数据,本文为您介绍使用Java SDK访问MaxCompute的代码示例。

文章 2024-11-21 来自:开发者社区

大数据分区优化存储成本

大数据分区是优化存储成本和提高数据处理效率的一个关键策略。通过合理地对大数据进行分区,可以显著减少数据扫描量,提高查询性能,同时还能降低存储成本。以下是几个优化大数据存储成本的分区策略: 1. 合理选择分区键 数据分布均匀:选择那些能让数据均匀分布在各个分区的键作为分区键,避免数据倾斜,即某个分区的...

文章 2023-08-25 来自:开发者社区

倚天性能优化--基于倚天优化后的zstd在大数据场景应用:降低存储成本+提升重IO场景性能

ZSTD VS Snappy算法多核(8cores)性能对比x86 snappy vs 倚天ptg-zstd: snappy算法的压缩率高36%;ptg-zstd解压性能高16.8%,压缩性能持平x86 snappy vs 倚天开源zstd: snappy算法的压缩率高36%;开源zstd解压性能低2%,压缩性能低13%Spark使用方法ztsd-jni-ali.jar包可联系zhuzhangq....

倚天性能优化--基于倚天优化后的zstd在大数据场景应用:降低存储成本+提升重IO场景性能
文章 2022-02-16 来自:开发者社区

大数据时代:如何节省存储成本

现今的科技发展日新月异。尤其是存储方面,表现的极其突出。从技术、用户和应用方面来看,其发展速度超越了其他IT领域。同时也带来了相应的问题。数据中心和企业的管理者们都面临着如何选择存储阵列的困惑。通常的解决方案早已被大肆宣传开来,例如像闪存存储或诸如WAN优化等这些被炒作已久的技术似乎已在人们脑海中变得根深蒂固。   下面的七个存储解决方案的建议不是基于任何技术的“新生事物”,而只是更具实用性并让....

大数据时代:如何节省存储成本

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

云原生大数据计算服务 MaxCompute存储相关内容

云原生大数据计算服务 MaxCompute您可能感兴趣

产品推荐

阿里巴巴大数据计算

阿里大数据官方技术圈

+关注