文章 2025-02-10 来自:开发者社区

续命Scaling Law?世界模型GPT-4o让智能体超级规划,OSU华人一作

随着人工智能技术的飞速发展,大模型在各个领域的应用日益广泛。其中,GPT-4o作为一款强大的语言模型,不仅在自然语言处理方面表现出色,更在智能体规划领域展现出了巨大的潜力。 GPT-4o,作为OpenAI的最新力作,不仅在语言理解和生成方面取得了显著进步,更在智能体规划领域展现出了惊人的能力。它能够...

文章 2024-12-10 来自:开发者社区

InternVL 2.5,首个MMMU超过70%的开源模型,性能媲美GPT-4o

01引言 近期Internvl2.5发布,性能与GPT-4o和Claude-3.5-sonnet等领先的商业模型相媲美,成为首个在MMMU上超过70%的开源模型,通过链式思考(CoT)推理实现了3.7个百分点的提升,展示了强大的测试时间可扩展性潜力。InternVL 2.5是基于InternVL 2.0发展而来,通过增强训练和测试策略以及提高数据质量来进一步提升性能。该模型在多个方面进行...

InternVL 2.5,首个MMMU超过70%的开源模型,性能媲美GPT-4o
文章 2024-10-19 来自:开发者社区

华为诺亚联合中科大发布工具调用模型ToolACE,效果持平GPT-4获开源第一

大型语言模型(LLM)的功能调用能力在近年来受到了广泛关注。通过功能调用,LLM的应用边界得到了显著扩展。然而,高质量、多样化的训练数据对于LLM功能调用能力的培养至关重要。现实中,功能调用数据的收集和标注非常具有挑战性,而现有流水线生成的合成数据往往覆盖不全、准确性不足。 为了解决上述问题,华为诺...

文章 2024-10-12 来自:开发者社区

2024-05-14 最新!OpenAI 新模型 GPT-4 omni 简单测试,4o速度确实非常快!而且很便宜!

目前已经可以正常使用了,有 PLUS 的用户 和 API 用户都可以访问了。 最新的 GPT-4 omni,官方宣称的是:2x faster and 50% cheaper. 问了同一个问题 结果都生成约700字 GPT-4 Turbo 128K 31.98秒 0.03刀 GPT-4o 13.92秒 0.01刀 模型介绍 ...

2024-05-14 最新!OpenAI 新模型 GPT-4 omni 简单测试,4o速度确实非常快!而且很便宜!
文章 2024-10-12 来自:开发者社区

LLM-03 大模型 15分钟 FineTuning 微调 GPT2 模型 finetuning GPT微调实战 仅需6GB显存 单卡微调 数据 10MB数据集微调

参考资料 GPT2 FineTuning OpenAI-GPT2 Kaggle short-jokes 数据集 Why will you need fine-tuning an LLM? LLMs are generally trained on public data with no specific focus. Fine-tuning is a cr...

LLM-03 大模型 15分钟 FineTuning 微调 GPT2 模型 finetuning GPT微调实战 仅需6GB显存 单卡微调 数据 10MB数据集微调
文章 2024-09-19 来自:开发者社区

通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o

9月19日云栖大会,阿里云CTO周靖人宣布,通义旗舰模型Qwen-Max全方位升级,性能接近GPT-4o。通义官网和通义APP的后台模型均已切换为Qwen-Max,继续免费为所有用户提供服务。用户也可通过阿里云百炼平台调用Qwen-Max的API。 相比上一代模型,Qwen...

通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o
文章 2024-08-21 来自:开发者社区

ARTIST的中文文图生成模型问题之通过GPT生成图像序列的问题如何解决

问题一:ARTIST模型如何通过GPT生成图像序列? ARTIST模型如何通过GPT生成图像序列? 参考回答: 在ARTIST模型中,GPT模型以文本序列和通过VQGAN编码后的图像序列作为输入,学习以文本序列为条件的图像序列生成。为了增强生成效果,模型还通过设计的Word Lattice Fusion Layer引入知识图谱中的实体知识,辅助图像中对应实体的生...

文章 2024-08-15 来自:开发者社区

模型遇见知识图谱问题之ARTIST模型通过GPT生成图像序列的问题如何解决

问题一:ARTIST模型如何通过GPT生成图像序列? ARTIST模型如何通过GPT生成图像序列? 参考回答: 在ARTIST模型中,GPT模型以文本序列和通过VQGAN编码后的图像序列作为输入,学习以文本序列为条件的图像序列生成。为了增强生成效果,模型还通过设计的Word Lattice Fusion Layer引入知识图谱中的实体知识,辅助图像中对应实体的生...

文章 2024-08-06 来自:开发者社区

ACL 2024:对25个开闭源模型数学评测,GPT-3.5-Turbo才勉强及格

在人工智能领域,大型语言模型(LLMs)在各种数学推理基准测试中取得了令人印象深刻的成绩。然而,关于这些模型是否真正理解和应用数学知识,还是仅仅依赖于数学推理的捷径,存在着越来越多的争议。为了评估LLMs在数学推理方面的鲁棒性,香港大学和腾讯AI实验室的研究人员引入了一种名为GSM-Plus的对抗性...

文章 2024-08-03 来自:开发者社区

公理训练让LLM学会因果推理:6700万参数模型比肩万亿参数级GPT-4

最近,一篇关于语言模型(LLM)的论文引起了广泛关注。该论文提出了一种名为"公理训练"的新方法,通过该方法,一个只有6700万参数的LLM能够学会因果推理,并在多个任务上表现出与万亿参数级的GPT-4相媲美的性能。 论文中,研究人员首先指出了因果推理在现实世界中的重要性。他们指出&#...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等