阿里云文档 2025-07-15

读写OSS数据

在PAI子产品(DLC或DSW)中,您可以使用ossfs 2.0客户端或JindoFuse组件(由阿里云EMR提供)将对象存储OSS类型的数据源挂载到容器的指定路径,也可以通过阿里云对象存储OSS提供的OSS Connector for AI/ML和OSS SDK来读取OSS数据。根据不同的应用场景,您可以选择合适的OSS数据读取方法。

文章 2025-04-26 来自:开发者社区

PyTabKit:比sklearn更强大的表格数据机器学习框架

长期以来Scikit-Learn 一直作为表格数据机器学习的主流框架,它提供了丰富的算法、预处理工具和模型评估功能。尽管 Scikit-Learn 功能完备,但随着技术的发展,新兴框架 PyTabKit 正逐渐崭露头角。该框架专为表格数据的分类和回归任务设计,集成了 RealMLP 等先进技术以及优化的梯度提升决策树(GBDT)超参数配置,为表格数据处理提供了新的技术选择。 Scikit-Lea....

PyTabKit:比sklearn更强大的表格数据机器学习框架
阿里云文档 2025-03-17

读写NAS数据

您可以在PAI子产品DLC、DSW或EAS中绑定NAS/CPFS类型数据集,用来存储训练和部署所需的文件及结果文件。本文以通用型NAS文件系统为例,为您介绍如何在PAI子产品中挂载NAS/CPFS类型数据集。

阿里云文档 2025-03-06

大语言模型数据增强与模型蒸馏解决方案

大语言模型的训练和推理过程存在高能耗及长响应时间等问题,这些问题限制了其在资源有限场景中使用。为了解决这些问题,PAI提出了模型蒸馏功能。该功能支持将大模型知识迁移到较小模型,从而在保留大部分性能的同时,大幅降低模型的规模和对计算资源的需求,为更多的实际应用场景提供支持。本文将以通义千问2(Qwen2)大语言模型为基础,为您介绍大语言模型数据增强和蒸馏解决方案的完整开发流程。

文章 2025-01-13 来自:开发者社区

Pandas数据应用:机器学习预处理

引言 在当今的数据驱动世界中,机器学习(ML)已经成为各个行业中不可或缺的一部分。然而,要使机器学习模型发挥最佳性能,数据的预处理是至关重要的一步。Pandas是一个强大的Python库,专门用于数据操作和分析,它为机器学习提供了许多便捷的功能。本文将由浅入深地介绍使用Pandas进行机器学习预处理...

Pandas数据应用:机器学习预处理
阿里云文档 2025-01-02

PAI-Rec推荐开发平台-运营工具-数据准备

本文档介绍为流量调控做数据准备、数据注册的过程

文章 2024-10-18 来自:开发者社区

EM算法对人脸数据降维(机器学习作业06)

EM算法对人脸数据降维(机器学习作业06) 第一题 第二题 代码如下: import numpy as np import os from PIL import Image from scipy.linalg import sqrtm def loadFile(filepath): sample_list = np.zeros((0, 112 * 92)) for roo...

EM算法对人脸数据降维(机器学习作业06)
阿里云文档 2024-09-24

读写MaxCompute数据

在PAI子产品(DLC或DSW)中,您可以通过阿里云MaxCompute提供的PyODPS或人工智能平台PAI自主研发的paiio,实现MaxCompute数据的读写操作。针对不同的应用场景,您可以选择合适的MaxCompute数据读取方式。

文章 2024-09-15 来自:开发者社区

利用未标记数据的半监督学习在模型训练中的效果评估

数据科学家在实践中经常面临的一个关键挑战是缺乏足够的标记数据来训练可靠且准确的模型。标记数据对于监督学习任务(如分类或回归)至关重要。但是在许多领域,获取标记数据往往成本高昂、耗时或不切实际。相比之下,未标记数据通常较易获取,但无法直接用于模型训练。 如何利用未标记数据来改进监督学习模型?这正是半监督学习的应用场景。半监督学习是机器学习的一个分支,它结合标记和未标记数据来训练模型,旨在获得比仅使....

文章 2024-08-31 来自:开发者社区

跨平台应用开发必备秘籍:运用 Uno Platform 打造高性能与优雅设计兼备的多平台应用,全面解析从代码共享到最佳实践的每一个细节

跨平台应用开发一直是软件工程师们关注的重点领域,Uno Platform 提供了一种使用 C# 和 XAML 构建跨平台应用的强大工具。本文将探讨在 Uno Platform 中实现跨平台应用的一些最佳实践,包括代码共享、平台特定功能、性能优化以及测试等方面,旨在帮助开发者构建高质量的跨平台应用。 首先,要充分实现 Uno Platform...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问