
Gemini是谷歌DeepMind团队基于2012年启动的人工智能研究计划开发的多模态大模型,为应对ChatGPT挑战,谷歌于2023年1月促使联合创始人回归并加速AI开发,历经PaLM、PaLM 2(2023年5月发布)等迭代阶段,于2023年12月6日正式发布。
该模型基于Transformer架构,采用原生多模态设计,支持文本、图像、音频、视频及代码的联合处理。初代Gemini 1.0包含Ultra(复杂任务)、Pro(通用场景)和Nano(移动端)三个版本,自2023年12月13日起通过Google AI Studio和Vertex AI平台向开发者开放API。
2024年2月,谷歌将旗下聊天机器人Bard更名为Gemini,推出Advanced版本,并发布Gemini 1.5。2024年12月,谷歌发布Gemini 2.0。2025年3月新增MTEB排名第一的Gemini Embedding模型及推理模型Gemini 2.5。2025年11月18日,谷歌正式发布Gemini 3。模型生态整合至谷歌搜索、广告系统、Chrome浏览器、智能家居及Android Auto车载系统,并在图像生成、编程辅助、长文本分析等场景广泛应用。
技术亮点包括TPU v5p芯片加速训练、稀疏专家混合(MoE)架构提升效率、支持100万token长上下文窗口。争议事件涉及2023年演示视频剪辑争议(联合创始人奥里奥尔·维尼亚尔斯否认造假指控)、2024年图像生成"反白人"偏见功能暂停、2024年9月商标侵权诉讼及2024年11月威胁信息事件。当地时间1月12日,苹果将使用谷歌Gemini大模型驱动其下一代基础模型,包括即将推出的改款Siri。2026年5月,谷歌推Gemini 3.5 Flash新模型。
常见问题 (FAQ)
Q1: gemini 是免费的吗?有什么限制?
A: 大部分AI工具提供免费试用或基础版。具体免费额度、生成次数及高级功能限制,请参考上文详细说明或访问官网查看最新定价策略。
Q2: 国内网络环境无法访问或报错怎么办?
A: 许多海外AI工具(如ChatGPT, Midjourney)需要特殊的网络环境。若遇到网络连接问题,请检查您的网络设置,或参考站内推荐的“网络加速工具”。
Q3: 如何使用该工具生成的图片/文本?版权归谁?
A: 通常情况下,付费用户拥有生成内容的商业使用权。但具体版权归属请务必阅读该工具官网的《服务条款》和《版权政策》,以避免法律纠纷。