文章 2024-09-17 来自:开发者社区

谷歌将大模型集成在实体机器人中,能看、听、说执行57种任务

近年来,人工智能领域取得了显著的进展,特别是在多模态大模型方面。谷歌的最新研究将大模型集成在实体机器人中,使其能够看、听、说并执行57种不同的任务。这一突破性的成果引起了广泛关注。 该研究的核心在于开发了一种名为Mobility VLA的系统,它结合了视觉、语言和行动的能力,使机器人能够理解并执行复杂的多模态指令。Mobili...

文章 2023-05-25 来自:开发者社区

耗时两年,谷歌用强化学习打造23个机器人帮助垃圾分类

机器之心编译编辑:王强以后垃圾分类这个活,可以交给机器人了。强化学习(RL)可以让机器人通过反复试错进行交互,进而学会复杂行为,并随着时间的推移变得越来越好。之前谷歌的一些工作探索了 RL 如何使机器人掌握复杂的技能,例如抓取、多任务学习,甚至是打乒乓球。虽然机器人强化学习已经取得了长足进步,但我们仍然没有在日常环境中看到有强化学习加持的机器人。因为现实世界是复杂多样的,并且随着时间的推移不断变....

耗时两年,谷歌用强化学习打造23个机器人帮助垃圾分类
文章 2023-05-18 来自:开发者社区

7 Papers & Radios | 谷歌开源机器人领域transformer;DeepMind推出剧本写作AI

本周主要论文包括谷歌机器人团队提出的多任务模型——Robotics Transformer 1 (RT-1),以及 DeepMind 用一句话生成一个剧本的写作型 AI。目录:RT-1: Robotics Transformer for Real-World Control at ScaleAbstract Visual Reasoning with Tangram ShapesRe^3 : G....

7 Papers & Radios | 谷歌开源机器人领域transformer;DeepMind推出剧本写作AI
文章 2023-05-18 来自:开发者社区

轻松完成700多条指令、成功率达97%!谷歌开源机器人领域transformer

谷歌机器人团队等在机器人领域构建了一个多任务 transformer 模型,显著改进了对新任务、环境和对象的零样本泛化。我们知道,机器学习(ML)多个子领域(如 NLP 和 CV)的最新重大进展通过一种共享的通用方法实现,该方法充分利用大规模、多样化数据集以及有效吸收所有数据的表达模型。尽管已经有各种尝试将这种方法应用于机器人技术,但机器人还没能利用到高性能模型。构成挑战的因素有几个。首先缺乏大....

轻松完成700多条指令、成功率达97%!谷歌开源机器人领域transformer
文章 2023-05-16 来自:开发者社区

谷歌让机器人充当大语言模型的手和眼,一个任务拆解成16个动作一气呵成

大模型在机器人领域找到了用武之地。 「我把饮料撒了,你能帮我一下吗?」这是我们日常生活中再正常不过的一句求助语。听到这句话,你的家人或朋友往往会不假思索地递给你一块抹布、几张纸巾或直接帮你清理掉。但如果换成机器人,事情就没有那么简单了。它需要理解「饮料撒了」、「帮我一下」是什么意思,以及到底要怎么帮。这对于平时只能听懂简单指令(如移动到 (x,y),抓取可乐瓶)的机器人来说确实有些困难。...

谷歌让机器人充当大语言模型的手和眼,一个任务拆解成16个动作一气呵成
文章 2023-05-12 来自:开发者社区

谷歌机器人「吃了」语言大模型后,会自学和思考了

【新智元导读】谷歌让机器人和大型语言模型学了本事,会自学了!以后不用等命令了,想干啥,只需吩咐一句。「上得厅堂,下得厨房」,这句对理想型贤内助的赞许,以后很可能要对谷歌的机器人说了。自带大型语言模型,会自学的机器人,见过吗?不会做?可以学!现在不会没关系,过一会儿学完了就会了。比起波士顿动力炫酷无比的上刀山,下火海,翻山越岭,如履平地的「铁面金刚」,这次谷歌搞的「会学习的机器人」更像是身边贴心的....

谷歌机器人「吃了」语言大模型后,会自学和思考了
文章 2023-05-12 来自:开发者社区

终结者最强大脑!谷歌发布史上最大「通才」模型PaLM-E,5620亿参数,看图说话还能操控机器人

 新智元报道  编辑:编辑部【新智元导读】谷歌刚刚上线了一个炸弹级「通才」模型PaLM-E,足足有5620亿参数。它是一种多模态具身视觉语言模型,从引导机器人执行任务,到回答关于可观察世界的问题,全都能搞定。大语言模型的飞速「变异」,让人类社会的走向越来越科幻了。点亮这棵科技树后,「终结者」的现实仿佛离我们越来越近。前几天,微软刚宣布了一个实验框架,能用ChatGPT来控制机....

终结者最强大脑!谷歌发布史上最大「通才」模型PaLM-E,5620亿参数,看图说话还能操控机器人
文章 2023-05-10 来自:开发者社区

谷歌机器人迈入「交互语言」新纪元!开放命令正确率高达93.5%,开源数据量提升十倍

【新智元导读】Google机器人最近实现了在开放词汇的条件下执行自然语言命令,真正实现了「听懂人话」,相关数据集已开源!注意看,眼前的这个男人正在对着一个机器人不断发出自然语言指令,如「把绿色的星推到红色块之间」、「把蓝色的方块移动到左下角」,机器人对每一次输入的指令都可以实时完成。,时长00:25自上世纪60年代开始,机器人专家就开始尝试让机器人听懂人的「自然语言指令」,并执行具体的行动。理想....

谷歌机器人迈入「交互语言」新纪元!开放命令正确率高达93.5%,开源数据量提升十倍
文章 2023-05-09 来自:开发者社区

谷歌机器人「吃了」语言大模型后,会自学和思考了

【新智元导读】谷歌让机器人和大型语言模型学了本事,会自学了!以后不用等命令了,想干啥,只需吩咐一句。「上得厅堂,下得厨房」,这句对理想型贤内助的赞许,以后很可能要对谷歌的机器人说了。自带大型语言模型,会自学的机器人,见过吗?不会做?可以学!现在不会没关系,过一会儿学完了就会了。比起波士顿动力炫酷无比的上刀山,下火海,翻山越岭,如履平地的「铁面金刚」,这次谷歌搞的「会学习的机器人」更像是身边贴心的....

谷歌机器人「吃了」语言大模型后,会自学和思考了
文章 2023-04-25 来自:开发者社区

用 ChatGPT 考一考谷歌 AI 聊天机器人 - Bard

面对微软在 AIGC 领域一拳又一拳的出击,谷歌也真的是坐不住了,最新发布对标 ChatGPT 的聊天机器人:Bard,中文意思是:吟游诗人(听这个产品的命名还有点浪漫主义感觉~)是骡子是马,总得拉出来遛一遛~本瓜第一时间加入了申请使用队列,也第一时间就获得了测试资格~传送门:bard.google.com/代理地区:美区界面如下:既然你是聊天机器人,那就聊聊吧?哦吼完求了,还不支持中文,不把 ....

用 ChatGPT 考一考谷歌 AI 聊天机器人 - Bard

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐