文章 2025-03-06 来自:开发者社区

阿里云百炼已上线超强推理开源模型QwQ-32B,尺寸更小,性能比肩DeepSeek满血版

最近的研究表明,强化学习可以显着提高模型的推理能力。例如,DeepSeek-R1通过整合冷启动数据和多阶段训练,实现了最先进的性能,使其能够进行深度思考和复杂推理。 这一次,主要探讨了大规模强化学习(RL)对大语言模型的智能提升作用,同时推出了我们最新的推理模型 QwQ-32B。这是一款拥有 320 亿参数的模型,其性能可与配备 6710 亿参数(其中 370 亿被激活)的 D...

阿里云百炼已上线超强推理开源模型QwQ-32B,尺寸更小,性能比肩DeepSeek满血版
问答 2025-02-21 来自:开发者社区

请问百炼平台免费的额度是只有推理调用可以使用是吗?我想部署模型调用的话会产生额外的费用是吗?

当前百炼平台送的免费额度是否可以部署和调优模型?

问答 2025-02-18 来自:开发者社区

Deepseek-R1作为模型的百炼应用,好像无法通过增量incremental的方式获得推理过程

见如下response输出: 好的,现在需要回答好的,现在需要回答用户的问题好的,现在需要回答用户的问题:“你有哪些能耐?”首先

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云百炼

基于通义系列大模型和开源大模型的一站式大模型服务平台,提供「生成式大模型的全流程应用工具」和「企业大模型的全链路训练工具」。为大模型,也为小应用。 阿里云百炼官网网址:https://www.aliyun.com/product/bailian

+关注