跨命名空间共享数据集
Fluid利用Kubernetes的命名空间(Namespace)资源隔离特性,确保了数据集在计算任务与数据访问层面的安全控制,有效满足了跨团队数据隔离的需求。更进一步,Fluid实现了跨命名空间的数据访问及缓存资源共享,这意味着公开数据集能够在多个团队间复用,实现了单次缓存、多团队共享的高效模式,增强了数据的利用效率与管理的灵活性,为研发团队间的协同作业提供了便利。本文介绍如何配置跨命名空间共享...
OSS Connector在AI/ML数据集处理中的性能表现
在进行大规模机器学习或深度学习项目时,数据的高效加载与处理是提升整体训练效率的关键因素之一。本文通过对比分析在使用OSS内网域名与启用OSS加速器的情况下,不同数据集构建方法(OssIterableDataset、OssMapDataset、结合Ossfs和ImageFolder)的性能差异,旨在为用户提供数据访问策略的优化指南。
如何配置数据集访问模式
Fluid弹性数据集的Dataset的访问模式默认设置为ReadOnlyMany(只读)。您可以通过修改Dataset.spec.accessModes字段指定Dataset访问模式。本文介绍如何配置数据集访问模式。
AI加速:如何在PAI中使用数据集加速器
在PAI平台创建数据集时,支持开启AI加速:数据集加速功能。您可以在创建DSW实例或提交DLC任务时,直接使用已开启加速的数据集,提升数据读取效率。本文为您介绍如何在PAI平台使用数据集加速器。
Google Earth Engine ——数据全解析专辑(COPERNICUS/S5P/NRTI/L3_AER_AI)紫外线气溶胶指数 (UVAI) 的近实时高分辨率数据集
NRTI/L3_AER_AI This dataset provides near real-time high-resolution imagery of the UV Aerosol Index (UVAI), also called the Absorbing Aerosol Index (AAI).The AAI is based on wavelength-dependent....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。
产品推荐
人工智能平台PAI
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。
+关注