人工智能平台 PAI评测的相关内容

文章 2025-02-17 来自：开发者社区

R1类模型推理能力评测手把手实战

随着DeepSeek-R1模型的广泛应用，越来越多的开发者开始尝试复现类似的模型，以提升其推理能力。目前已经涌现出不少令人瞩目的成果。然而，这些新模型的推理能力是否真的提高了呢？EvalScope框架是魔搭社区上开源的评估工具（https://github.com/modelscope/evalscope），提供了对R1类模型的推理性能的评测能力。在本最佳实践中，我们通过728道推理题...

文章 2025-02-14 来自：开发者社区

R1类模型推理能力评测手把手实战

文章 2024-11-27 来自：开发者社区

Qwen2.5-Coder 系列模型在 PAI-QuickStart 的训练、评测、压缩及部署实践

Qwen2.5-Coder 是阿里云最新推出的专门针对代码的 Qwen 大型语言模型系列。目前，Qwen2.5-Coder 覆盖了多种主流模型尺寸：0.5B、1.5B、3B、7B、14B 和 32B，以满足不同开发人员的需求。Qwen2.5-Coder 将训练 tokens 扩展到 5.5 万亿，在代码生成、代码推理和代码纠错能力方面有着显...

阿里云文档 2024-11-20

通义千问2.5模型部署与微调

通义千问2.5（Qwen2.5）是阿里云研发的通义千问系列开源大模型。该系列提供Base和Instruct等多版本、多规模的开源模型，从而满足不同的计算需求。PAI已对该系列模型进行全面支持，本文以通义千问2.5-7B-Instruct模型为例为您介绍如何在Model Gallery中部署、微调和评测该系列模型（本文适用于Qwen2.5和Qwen2系列模型）。

文章 2024-11-20 来自：开发者社区

DistilQwen2 蒸馏小模型在 PAI-QuickStart 的训练、评测、压缩及部署实践

Qwen2（通义千问2）是阿里云研发的开源大型语言模型系列，具有很强的代码、数学、推理、指令遵循、多语言理解等能力。DistilQwen2 是阿里云人工智能平台 PAI 基于 Qwen2 大模型推出的、通过知识蒸馏进行指令遵循效果增强的、参数较小的语言模型。这一系列模型在移动设备、边缘计算等资源受限的环境中具有更高的性能，在较小参数规模下&...

阿里云文档 2024-11-18

大模型评测案例

在大模型时代，模型评测是衡量性能、精选和优化模型的关键环节，对加快AI创新和实践至关重要。PAI大模型评测平台支持多样化的评测场景，如不同基础模型、微调版本和量化版本的对比分析。本文为您介绍针对于不同用户群体及对应数据集类型，如何实现更全面准确且具有针对性的模型评测，从而在AI领域可以更好地取得成就。

阿里云文档 2024-10-22

大模型评测

文章 2024-10-21 来自：开发者社区

PAI 大语言模型评测平台现已支持裁判员模型评测

在大模型时代，随着模型效果的显著提升，模型评测的重要性日益凸显。为了有效评价大语言模型(LLM)，业界提供了多种基准测试，例如 MMLU、CMMLU，GSM8K 等。但是，这些基准测试更多是针对确定性问题及确定性表述，评测 LLM 在开放场景下的能力（例如聊天助手）仍然是...

文章 2024-07-17 来自：开发者社区

带你读《阿里云产品六月刊》——十一、阿里云PAI大模型评测最佳实践

简介：在大模型时代，模型评测是衡量性能、精选和优化模型的关键环节，对加快AI创新和实践至关重要。PAI大模型评测平台支持多样化的评测场景，如不同基础模型、微调版本和量化版本的对比分析。本文为您介绍针对于不同用户群体及对应数据集类型，如何实现更全面准确且具有针对性的模型评测，从而在AI领域可以更好地取得成就。作者：施晨、之用、南茵、求伯、一耘、临在在大模...

文章 2024-06-19 来自：开发者社区

阿里云PAI大模型评测最佳实践

作者：施晨、之用、南茵、求伯、一耘、临在在大模型时代，模型评测是衡量性能、精选和优化模型的关键环节，对加快AI创新和实践至关重要。PAI大模型评测平台支持多样化的评测场景，如不同基础模型、微调版本和量化版本的对比分析。本文为您介绍针对于不同用户群体及对应数据集类型，如何实现更全面准确且具有针对性的模型评测，从而在AI领域可以更好地取得成就。背景信息内容简介 ...

共有20条

< 1 2 >

跳转至： GO

更新时间 2025-02-18 13:04:36

本页面内关键词为智能算法引擎基于机器学习所生成，如有任何问题，可在页面下方点击"联系我们"与我们沟通。

人工智能平台 PAI您可能感兴趣

产品推荐

热门帮助文档

人工智能平台PAI

人工智能平台 PAI（Platform for AI，原机器学习平台PAI）是面向开发者和企业的机器学习/深度学习工程平台，提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务，内置140+种优化算法，具备丰富的行业场景插件，为用户提供低门槛、高性能的云原生AI工程化能力。

+关注

热门技术解决方案

高价值用户挖掘及触达

本方案使用阿里云机器学习平台 PAI 的强大算法能力，通过对用户数据的计算和预测，辅助客户对人群营销决策的判断，在用户召回，流失预测，高价值用户寻找等多个运营场景，帮助客户降低成本，提高效率，客户可通过短信的方式触达用户，完成营销触达的全链路操作。

了解更多