云原生企业级数据湖

基于对象存储 OSS 构建的数据湖支持多种数据输入和存储格式,实现数据整合与分析,直接从 OSS 进行大数据分析以挖掘业务价值。数据湖还提供冷热数据分层和生命周期管理,优化存储成本。

适用客户
  • 面临数据孤岛问题的企业
  • 需处理海量数据并降低成本的企业
  • 追求高效数据分析与洞察的企业
  • 方案优势
  • 架构与部署
  • 应用场景
  • 免费试用
  • 推荐解决方案
  • 方案优势

    为什么选择云原生企业级数据湖

    一份存储、多种引擎

    各种类型的数据以集中方式统一存储在对象存储 OSS,解决数据孤岛,避免数据分散在多种不同的系统,极大降低运维管理难度。

    数据无需处理、直接存储

    支持结构化、半结构化、非结构化等多种类型数据,数据可以按照原始产生的形态直接存储到数据湖,提供便捷的数据接入和数据消费通道。

    计算与存储解耦合

    提供更灵活的系统架构设计,通过细粒度的权限控制、数据加密和日志记录与审计等机制保障数据安全。

    架构与部署

    云原生企业级数据湖

    对象存储 OSS 作为数据湖统一存储,可以存储来自于不同数据源的各类型数据。 通过多种存储类型实现数据冷热分层,可无缝对接 EMR、PAI 等大数据分析和训练引擎。

    结合高性能文件存储 CPFS,实现 OSS 与 CPFS 数据双向流通,同时,热点训练数据以透明方式同步到 CPFS,通过 CPFS 的文件语义与机器学习平台 PAI 对接,满足高性能训练场景需求。

    部署时长:80 分钟
    预估费用:5 元(假设您选择最低规格资源,且资源运行时间不超过 30 分钟。如调整了资源规格,请以控制台显示的实际报价以及最终账单为准)
    应用场景

    技术方案的广泛应用场景

  • 基于开源生态构建大数据分析

    支撑 Hadoop 开源生态构建大数据分析方案,解决了传统 Hadoop 在扩展性、运维模式、成本优化方面的难题。

  • 海量数据冷热分层

    大数据场景中有大量数据累积,并且数据随着时间推移访问热度会大幅降低。解决了数据分散在各个集群,优化长期存储成本。

  • 基于数据湖的人工智能

    数据湖支持 AI 的关键流程,包括数据存储、预处理、特征提取、模型训练和部署,利用机器学习平台的技术优势,提高训练速度。

  • 免费试用

    阿里云为您提供云产品免费试用

    技术解决方案咨询
    立即咨询