当前位置:首页 > 技术分享 > 正文内容

Gemini :谷歌发布最强AI大模型!打爆GPT-4

lmwmm2年前 (2023-12-12)技术分享1836

Gemini :谷歌发布最强AI大模型!打爆GPT-4

 

1.Gemini 官网:【链接直达

2.谷歌Bard:【链接直达

 

谷歌Gemini背后技术的杀手锏,便是原生多模态(natively multimodal)。

因为以往创建多模态大模型的方法,通常是为不同的模态训练单独的组件,然后将它们拼接在一起,大致模拟其中的一些功能。

这样训练出来的模型虽然有时可以很好地执行某些任务(比如描述图像),但在面对更具概念性和复杂推理的情况下,就会出现表现不佳的结果。

而谷歌Gemini所强调的原生多模态,是指从一开始就对不同的模态进行预训练,然后用额外的多模态数据对其进行微调,以此来进一步完善大模型的有效性。

具体来说,此次谷歌一共带来了Gemini的三个版本:

  • Gemini Ultra:谷歌最大、最强模型,适用于高度复杂的任务

  • Gemini Pro:可扩展至各种任务的Gemini模型

  • Gemini Nano:适用于端侧设备的高效Gemini版本(1.8B/3.25B)

其中Gemini Ultra一上来就在32个基准测试中拿下30个SOTA,并且第一个在MMLU基准上达到人类专家水平

而Gemini Pro从今天起,就会在Bard中实装上线。

 


扫描二维码推送至手机访问。

版权声明:本文由点度点度金讯时代-BLOG发布,如需转载请注明出处。

本文链接:https://lmwmm.com/post/1761.html

分享给朋友:

“Gemini :谷歌发布最强AI大模型!打爆GPT-4” 的相关文章

中国联通被勒令60天内停止在美业务

中国联通被勒令60天内停止在美业务

1,接二连三无理打压!中国联通被勒令60天内停止公司在美业务 当地时间周四(1月27日),美国联邦通信委员会(FCC)以所谓“出于国家安全考虑”为由,以4比0的投票结果决定撤销中国联通子公司的214牌照。(财联社) 2,富祥药业自导…

普通2.4g遥控车改4g遥控车资料-8266

普通2.4g遥控车改4g遥控车资料-8266

  背景:传统遥控器都是航模为代表的2.4G遥控器,它们在室外且无障碍物时遥控距离很长,可达几千米,但是有障碍物时,遥控距离可能仅有10多米。市面上也有一些2.4g遥控改装4G的,是读取2.4g遥控信号,并转发至服务器,…

ChatGPT-4重磅发布,10秒做出一个网站,全面碾压上一代

ChatGPT-4重磅发布,10秒做出一个网站,全面碾压上一代

今日,#GPT4做一个网站只要十秒#的话题引发网友热议。据报道,当地时间周二(3月14日),人工智能研究公司OpenAI公布了其大型语言模型的最新版本——GPT-4。相比前一个版本,它有多强大?10秒钟做出一个网站一则有关GPT4发布会的视…

最近热度“狂飙”的ChatGPT,到底什么来头?

最近热度“狂飙”的ChatGPT,到底什么来头?

最近的朋友圈和互联网,除了在话题中心“狂飙”的高家三兄妹/全员恋人安欣/迈克杰克驴以外,还有就是出道两个月就火出圈的 ChatGPT 。ChatGPT 是个什么鬼东西?ChatGPT 作为一款人工智能机器人,上知天文,下知地理,能写文章、能…

用ChatGPT写假新闻!深圳一自媒体公司法人代表被抓

用ChatGPT写假新闻!深圳一自媒体公司法人代表被抓

ChatGPT问世以来,引发了不小的争议。最让人担心的事发生了——有人用它制作假新闻!此前,一篇题为《今晨甘肃一火车撞上修路工人致9人死亡》的“新闻”吸引了甘肃省平凉市警方的注意,并引发网友关注。经判定,这是一篇假新闻,警方进一步侦查发现,…

科大讯飞再燃大模型“战火”,赶超ChatGPT并非目的,应用端才是关键

科大讯飞再燃大模型“战火”,赶超ChatGPT并非目的,应用端才是关键

日前,科大讯飞发布星火认知大模型,让火热的“大模型”战场再燃战火。对自家产品,科大讯飞董事长刘庆峰称,“三项能力超过ChatGPT”。如今,国内大模型战场,已经汇聚百度、阿里、华为、腾讯等重磅玩家。这些大模型,与ChatGPT有多远的距离?…