模型GPT-阿里云

文章 2025-02-10 来自：开发者社区

续命Scaling Law？世界模型GPT-4o让智能体超级规划，OSU华人一作

随着人工智能技术的飞速发展，大模型在各个领域的应用日益广泛。其中，GPT-4o作为一款强大的语言模型，不仅在自然语言处理方面表现出色，更在智能体规划领域展现出了巨大的潜力。 GPT-4o，作为OpenAI的最新力作，不仅在语言理解和生成方面取得了显著进步，更在智能体规划领域展现出了惊人的能力。它能够...

文章 2024-12-10 来自：开发者社区

InternVL 2.5，首个MMMU超过70%的开源模型，性能媲美GPT-4o

01引言近期Internvl2.5发布，性能与GPT-4o和Claude-3.5-sonnet等领先的商业模型相媲美，成为首个在MMMU上超过70%的开源模型，通过链式思考（CoT）推理实现了3.7个百分点的提升，展示了强大的测试时间可扩展性潜力。InternVL 2.5是基于InternVL 2.0发展而来，通过增强训练和测试策略以及提高数据质量来进一步提升性能。该模型在多个方面进行...

文章 2024-10-19 来自：开发者社区

华为诺亚联合中科大发布工具调用模型ToolACE，效果持平GPT-4获开源第一

大型语言模型（LLM）的功能调用能力在近年来受到了广泛关注。通过功能调用，LLM的应用边界得到了显著扩展。然而，高质量、多样化的训练数据对于LLM功能调用能力的培养至关重要。现实中，功能调用数据的收集和标注非常具有挑战性，而现有流水线生成的合成数据往往覆盖不全、准确性不足。为了解决上述问题，华为诺...

文章 2024-10-12 来自：开发者社区

2024-05-14 最新！OpenAI 新模型 GPT-4 omni 简单测试，4o速度确实非常快！而且很便宜！

目前已经可以正常使用了，有 PLUS 的用户和 API 用户都可以访问了。最新的 GPT-4 omni，官方宣称的是：2x faster and 50% cheaper. 问了同一个问题结果都生成约700字 GPT-4 Turbo 128K 31.98秒 0.03刀 GPT-4o 13.92秒 0.01刀模型介绍 ...

文章 2024-10-12 来自：开发者社区

LLM-03 大模型 15分钟 FineTuning 微调 GPT2 模型 finetuning GPT微调实战仅需6GB显存单卡微调数据 10MB数据集微调

参考资料 GPT2 FineTuning OpenAI-GPT2 Kaggle short-jokes 数据集 Why will you need fine-tuning an LLM? LLMs are generally trained on public data with no specific focus. Fine-tuning is a cr...

文章 2024-09-19 来自：开发者社区

通义千问升级旗舰模型Qwen-Max，性能接近GPT-4o

9月19日云栖大会，阿里云CTO周靖人宣布，通义旗舰模型Qwen-Max全方位升级，性能接近GPT-4o。通义官网和通义APP的后台模型均已切换为Qwen-Max，继续免费为所有用户提供服务。用户也可通过阿里云百炼平台调用Qwen-Max的API。相比上一代模型，Qwen...

文章 2024-08-21 来自：开发者社区

ARTIST的中文文图生成模型问题之通过GPT生成图像序列的问题如何解决

问题一：ARTIST模型如何通过GPT生成图像序列？ ARTIST模型如何通过GPT生成图像序列？参考回答：在ARTIST模型中，GPT模型以文本序列和通过VQGAN编码后的图像序列作为输入，学习以文本序列为条件的图像序列生成。为了增强生成效果，模型还通过设计的Word Lattice Fusion Layer引入知识图谱中的实体知识，辅助图像中对应实体的生...

文章 2024-08-15 来自：开发者社区

模型遇见知识图谱问题之ARTIST模型通过GPT生成图像序列的问题如何解决

问题一：ARTIST模型如何通过GPT生成图像序列？ ARTIST模型如何通过GPT生成图像序列？参考回答：在ARTIST模型中，GPT模型以文本序列和通过VQGAN编码后的图像序列作为输入，学习以文本序列为条件的图像序列生成。为了增强生成效果，模型还通过设计的Word Lattice Fusion Layer引入知识图谱中的实体知识，辅助图像中对应实体的生...

文章 2024-08-06 来自：开发者社区

ACL 2024：对25个开闭源模型数学评测，GPT-3.5-Turbo才勉强及格

在人工智能领域，大型语言模型（LLMs）在各种数学推理基准测试中取得了令人印象深刻的成绩。然而，关于这些模型是否真正理解和应用数学知识，还是仅仅依赖于数学推理的捷径，存在着越来越多的争议。为了评估LLMs在数学推理方面的鲁棒性，香港大学和腾讯AI实验室的研究人员引入了一种名为GSM-Plus的对抗性...

文章 2024-08-03 来自：开发者社区

公理训练让LLM学会因果推理：6700万参数模型比肩万亿参数级GPT-4

最近，一篇关于语言模型（LLM）的论文引起了广泛关注。该论文提出了一种名为"公理训练"的新方法，通过该方法，一个只有6700万参数的LLM能够学会因果推理，并在多个任务上表现出与万亿参数级的GPT-4相媲美的性能。论文中，研究人员首先指出了因果推理在现实世界中的重要性。他们指出&#...