Gemini

Google官方出品

Gemini(/ˈɛmɪn/;前称Bard,中文意为双子座),是由Google开发的生成式AI聊天机器人,架构基于同名大型语言模型。Gemini是为了应对OpenAI公司开发的ChatGPT聊天机器人的崛起而开发的。其在2023年3月以有限的规模推出,2023年5月扩展到更多个国家。2024年2月8日从Bard更名为Gemini。

最初基于LaMDA系列大型语言模型(LLM),后来基于PaLM2(LLM),现基于Gemini系列大型语言模型。

概要

Bard于2023年2月6日发布,并于同年3月21日推出,首批开放美国、英国的用户申请加入等待名单。它的第一个版本是使用该公司在2021年发布的LaMDA大型语言模型开发的。2023年4月10日,改用更强大的PaLM大型语言模型,以增强其运算能力,并与ChatGPT竞争。2023年5月10日,PaLM被进一步更新为PaLM2,这次的更新,实现了多语言翻译和增强的逻辑推理能力。2023年5月10日举行的Google开发者大会“Google I/O 2023”上,宣布增加对日语和韩语的支持,并取消等待名单,且在更多个国家可用。2023年7月13日,Bard开始支持中文。2023年12月6日,Bard换用Gemini Pro大型语言模型,获得迄今为止对Bard最大的升级。得益于Gemini Pro模型,Bard在文本理解,总结、推理、编码及规划等方面获得了一定程度的加强。2024年2月8日,Bard更名为Gemini;并推出Gemini Advanced服务,让用户可以访问Google目前最先进的大型语言模型Gemini Ultra 1.0。

背景

2022年11月,OpenAI推出基于GPT-3大型语言模型的聊天机器人ChatGPT ,引起了全球关注,成为了一个爆红现象。 Google高层对ChatGPT的潜在威胁感到忧虑,并发出“代码红色”警报,重新指派了几个团队来协助公司的人工智能(AI)研发。 Google和母公司Alphabet的CEO 桑德尔·皮查伊被广泛报导发出警报,但后来向《纽约时报》否认了这一点。 在2019年辞去了Alphabet共同CEO职务的Google联合创始人拉里·佩奇和谢尔盖·布尔,不同寻常地被召集参加了与公司高层的紧急会议,讨论ChatGPT对Google的威胁。 在同年初,该公司推出了LLM原型LaMDA,但没有对外公开发布。 在一次全体员工会议上,有人问“ChatGPT的突然爆火,是否代表着谷歌在人工智能领域“错失了机会””,桑德尔·皮查伊和Google AI首席杰夫·迪恩表示:“谷歌的人工智能语言模型与 OpenAI 的人工智能语言模型一样强大,但由于该技术带来的“声誉风险”,该公司不得不“比小型初创公司更保守”” 2023年1月,DeepMind的CEO 杰米斯·哈萨比斯 暗示计划推出一款与ChatGPT竞争的产品,并指示Google(谷歌)的员工优先处理这些项目。 桑德尔·皮查伊在Google的季度盈利投资者电话会议中向投资者保证,公司有计划扩大LaMDA的可用性和应用。

历史

公告

2023年2月6日,Google宣布推出由LaMDA驱动的对话式生成人工智能聊天机器人Bard。 该产品首先向选定的1万名“信任测试者”推出,并在月底进行广泛发布。 Bard由产品负责人Jack Krawczyk监督,他将该产品描述为一种“协作人工智能服务”而非搜索引擎,而Pichai详细介绍了Bard将如何融入Google搜索。 根据路透社的估算,如果将ChatGPT类似的功能添加到Google,到2024年将使公司增加60亿美元的额外开支,而研究和咨询公司 SemiAnalysis则估计这将使Google增加30亿美元的开支。 该技术是在代号“Atlas”下开发的,bard以凯尔特语中的说故事者名称命名,以“反映该算法内部的创意性质”。 许多媒体机构和金融分析师将Google描述为“急于行动”,在“Microsoft计划于2月7日揭晓其与OpenAI合作将ChatGPT集成到其Microsoft Bing搜索引擎”之前先发布Bard的公告,同时将其视为Google正在“追赶”微软。 The Verge的Tom Warren和彭博社的Davey Alba指出,这事件标志着这两家大型科技公司将展开一场“搜索之争”,在他们六年的“休战”于2021年结束; 卫报的Chris Stokel-Walker和Recode的Sara Morrison和投资公司Wedbush Securities的分析师Dan Ives称此为两家公司之间的一场人工智能的“军备竞赛”。

2月8日,Google巴黎举行直播展示Bard后,Google的股价下跌了8%,相当于市值损失1000亿美元,该直播的YouTube影片被设为私有。 许多观众还指出在演示中Bard在对查询回答时,给出的关于詹姆斯·韦伯太空望远镜的信息是不正确的。 Google员工批评皮查伊“仓促”地宣布Bard,并在公司的内部论坛Memgen上表示抗议,而Futurism的Maggie Harrison则称这次推出是“混乱的”。 Pichai则表示Google已经“长时间深入地研究人工智能”来捍卫自己的行动,否认Bard的推出是膝反应。 Alphabet董事长约翰·轩尼诗承认Bard还没有完全准备就绪,但他对技术的潜力感到兴奋。

在詹姆斯·韦伯事件发生一周后,Pichai要求员工花两到四个小时进行Bard的自用测试,而Google高管Prabhakar Raghavan鼓励员工纠正Bard的任何错误。 有8万名员工响应Pichai的号召。在接下来的几周里,Google员工在内部消息中对Bard进行了广泛的批评,引用了多种安全及道德上的担忧,并呼吁公司领导层不要推出该服务。为了优先及跟上竞争对手,Google高管决定无论如何都要推出该产品。 同月底,Pichai突然解雇了1万2千名员工,原因是收入增长减缓,剩余的员工通过分享梗图和与Bard的幽默交流,征求Bard对解雇的“意见”。 Google员工在3月中旬开始测试一个Bard的更高级版本(带有更大参数),被称为“Big Bard”。

推出

2023年3月21日Google开放了Bard的早期访问,容量有限,只允许美国和英国的用户加入等待名单。与Microsoft在Bing上的做法不同,Bard作为一个独立的Web应用程序推出,其中包含一个文本框和免责声明,并表示该聊天机器人“可能显示不准确或冒犯性的内容,不代表Google的观点”。然后,每个问题会提供三个回答,用户可以提交对每个答案有用程度的反馈。Google副总裁Sissie Hsiao和Eli Collins将Bard视为对Google搜索的补充,并表示该公司尚未确定如何使该服务盈利。 获得早期访问权限的人包括参加Google的“Pixel Superfans忠诚计划”的人,包含Google Pixel和Google Nest设备的用户,以及Google One订阅者。

Bard是由Google聘请的第三方承包商培训,包括Appen和Accenture的工作人员,据商业内幕和彭博社的报导,这些工作人员承受着极大的压力,过度工作且待遇不公。 Bard在初次推出后不久,Google对其虚拟助手团队进行了重组,并将重心转向了Bard。 Google研究员Jacob Devlin在声称Bard暗中利用了ChatGPT的数据后辞去了Google的职务;Google否认了这些指控。 3月31,Pichai日透露,公司打算通过基于Google的新型更强大的LLM PaLM而不是LaMDA来“升级” Bard。 在同一天,Krawczyk宣布Google为Bard添加了“数学及逻辑功能”。 4月,Bard增加了协助编程的功能,推出时与20多种编程语言兼容。微软开始在开发者版Edge浏览器的地址栏上运行广告,鼓励用户每次访问Bard Web应用程序时尝试Bing。Google正在努力将Bard集成到其ChromeOS操作系统和Pixel设备中。

在2023年5月的年度Google I/O主题演讲中,Pichai和Hsiao宣布了一系列Bard的更新,包括采用PaLM 2,与其他Google产品和第三方服务集成,扩展到180个国家,支持更多语言以及新功能。扩展推出未包括欧盟的任何国家,可能反映出对通用数据保护条例的遵从担忧。拥有Google Workspace账户的用户也获得了访问权限。6月,Google试图将Bard推出到欧州,但遭到了爱尔兰Data Protection Commission的阻挡,后者要求该公司提交一份“数据保护影响评估”。7月,Google在欧州和巴西推出了Bard,增加了几十种新语言,并引入了多种新的个性化和生产力功能。

2024年2月8日,Bard更名为Gemini。同时Google推出Gemini的影像生成功能。该功能推出不久后,Gemini却因为过度政治正确生成了诸如多张有色人种纳粹士兵以及有色人种美国开国元勋的图像。很快Google宣布暂停Gemini生成人像功能。

同年下半年,Gemini Live最初于2024年8月由Google推出,并于同年随Pixel 9系列首次亮相,成为该系列设备的默认虚拟助理,取代原有的Google助理。之后于 2025年7月开始扩展至Galaxy S25系列, 随后也支持如Z Fold 7与 Z Flip 7等机型,并成为Galaxy AI功能包的一部分。

2024年12月11日,Google发布了首个Gemini 2.0系列的人工智能模型,即Gemini 2.0 Flash。2025年3月25日,Gemini 2.5发布。 2025年6月5日,Gemini 2.5 Pro发布。

2025年11月,Google推出的Gemini 3系列,在推理、编码与多模态能力上实现了显著升级。

服务

Google One AI Premium

2024年2月8日,Google推出了Google One AI Premium,它是一项订阅制付费计划,每月收费19.99美元。项目包括了Gemini Advanced及Google One Premium。

Gemini Advanced是Google One AI Premium订阅计划中的一部分,订阅者可以访问Google推出的大型语言模型Gemini语言模型的最新版。

应用程序

2024年2月8日,Google发布适用于Android系统的Gemini APP。此Android应用程序目前仅支持美国地区及英语,Google计划在未来几周支持更多地区及语言。

Android系统用户可在Google Play中下载Google Gemini APP。而iOS则使用Google APP访问Gemini。

反应

Bard在最初发布时收到了褒贬不一的评论。 The Verge的詹姆斯·文森特(James Vincent)认为Bard比ChatGPT及Bing更快,但他指出Bard缺乏类似Bing的准确性,既是一种祝福又是一种诅咒。这鼓励Google在尝试人工智能时更加大胆。 他的同事大卫·皮尔斯(David Pierce)对Bard无趣且有时不准确的回答感到印象深刻,他补充说,尽管Google宣称Bard不是搜索引擎,但其用户界面和搜索引擎相似,这可能会给Google带来问题。 纽约时报的Cade Metz称赞Bard比ChatGPT有着“更谨慎”的处理能力,而Vox的Shirin Ghaffary称其回答干燥而无争议,这是由于其回答的保守性质。 在与Hsiao、Google高级副总裁詹姆斯·马尼卡(James Manyika)和Pichai在60 分钟的访谈中,CBS News记者Scott Pelley发现Bard让人感到“不安”。宾夕法尼亚大学沃顿商学院副教授伊桑·莫利克(Ethan Mollick)对Bard的艺术能力感到失望。 纽约时报后来进行了一项测试,测试ChatGPT和Bard处理人类助手任务所需的能力,并得出结论,ChatGPT的表现远远优于Bard。评估新闻文章的可信度的工具NewsGuard发现Bard在揭穿已知阴谋论方面比ChatGPT更有技巧。

留言评论