当前位置:首页 > 技术分享 > 正文内容

Gemini :谷歌发布最强AI大模型!打爆GPT-4

lmwmm2年前 (2023-12-12)技术分享2297

 

1.Gemini 官网:【链接直达

2.谷歌Bard:【链接直达

 

谷歌Gemini背后技术的杀手锏,便是原生多模态(natively multimodal)。

因为以往创建多模态大模型的方法,通常是为不同的模态训练单独的组件,然后将它们拼接在一起,大致模拟其中的一些功能。

这样训练出来的模型虽然有时可以很好地执行某些任务(比如描述图像),但在面对更具概念性和复杂推理的情况下,就会出现表现不佳的结果。

而谷歌Gemini所强调的原生多模态,是指从一开始就对不同的模态进行预训练,然后用额外的多模态数据对其进行微调,以此来进一步完善大模型的有效性。

具体来说,此次谷歌一共带来了Gemini的三个版本:

  • Gemini Ultra:谷歌最大、最强模型,适用于高度复杂的任务

  • Gemini Pro:可扩展至各种任务的Gemini模型

  • Gemini Nano:适用于端侧设备的高效Gemini版本(1.8B/3.25B)

其中Gemini Ultra一上来就在32个基准测试中拿下30个SOTA,并且第一个在MMLU基准上达到人类专家水平

而Gemini Pro从今天起,就会在Bard中实装上线。

 


扫描二维码推送至手机访问。

版权声明:本文由点度点度金讯时代-BLOG发布,如需转载请注明出处。

本文链接:https://lmwmm.com/post/1761.html

分享给朋友:

“Gemini :谷歌发布最强AI大模型!打爆GPT-4” 的相关文章

让文心一言和ChatGPT帮我设计开源项目,结果……

让文心一言和ChatGPT帮我设计开源项目,结果……

hi,我是一名电子工程师。作为一名有着创新精神的潮男,大洋彼岸ChatGPT的热风刚吹来,我就率先在上面提了一个人类永恒的话题:先有鸡还是先有蛋?而刚刚,我又获得了有“中国版ChatGPT”之称的文心一言内测资格,这次我决定让它帮我设计一个…

ChatGPT能上传文件了,文档图片数据集秒理解,代码一键执行

ChatGPT能上传文件了,文档图片数据集秒理解,代码一键执行

梦晨 发自 凹非寺量子位 | 公众号 QbitAIChatGPT又出试验型新模式,不少网友陆续收到代码解释器Alpha测试资格。简单来说,这个模式提供两个功能:执行Python代码,接受文件上传下载。为什么是这两个功能的组合?可以看目前最火…

运维:Windows11操作系统安装VMware16.1.1图文教程

运维:Windows11操作系统安装VMware16.1.1图文教程

一、VMware 16.1.1 介绍VMware 16.1.1 是一款功能非常强大虚拟化软件,它允许用户在一台计算机上创建和运行多个虚拟机(Virtual Machine)相当于拥有多台服务器。这些虚拟机可以模拟独立的操作系统和硬件环境,使…

Windows 12发布时间曝光!

Windows 12发布时间曝光!

[摘要]多方消息显示,微软正在准备发布 "突破性 "的以人工智能为中心的新一代Windows版本,内部代号 "Hudson Valley "(哈德逊河谷)。 快科技12月10日消息,多方消息显示,微…

《瘟疫传说:无罪》现已登陆Epic Games Store,尽情畅玩BB电子游戏精彩体验

《瘟疫传说:无罪》现已登陆Epic Games Store,尽情畅玩BB电子游戏精彩体验

Asobo Studio与Focus Home Interactive合作推出的《瘟疫传说:无罪》(A Plague Tale: Innocence)是一部于2019年问世的精彩电子游戏。游戏以14世纪法国黑死病的背景为舞台,讲述了年轻的艾…

手机回归BBIN实体按键:专为iPhone设计的电子按键保护壳

手机回归BBIN实体按键:专为iPhone设计的电子按键保护壳

英国新兴企业Clicks即将在2024年CES展会上展示一款专为iPhone用户设计的保护套,满足那些寻求实体按键感需求的BB Games电子游戏玩家。这款配件允许用户在下方的实体按键来输入文内容或玩BB热门游戏。类似的设计在过去曾有过,B…