Google Gemini
AI聊天工具 最新热门工具
Google Gemini

Gemini 是谷歌公司开发的一款人工智能大模型

发展历程

  • 2023 年 4 月,Alphabet(谷歌母公司)首席执行官桑达尔・皮查伊合并了两个大型人工智能团队,开启相关研究计划。
  • 2023 年 5 月,谷歌在开发者大会上透露正在开发 AI 大模型 Gemini。
  • 2023 年 8 月,谷歌在其面向印度和日本用户的搜索工具中引入了生成式人工智能。
  • 2023 年 9 月,向少数公司开放了其对话式人工智能软件 Gemini 的早期版本。
  • 2023 年 12 月 6 日,推出 Gemini 1.0 版本,包括 Gemini Ultra、Gemini Pro 和 Gemini Nano 三个不同规格。
  • 2024 年 2 月 15 日,发布 Gemini 1.5。
  • 2024 年 5 月 15 日,更新升级 Gemini 1.5 Pro 版本,同时推出 Gemini 1.5 Flash 轻量化小模型。
  • 2024 年 12 月 12 日,发布 Gemini 2.0,第一个版本为 Gemini 2.0 Flash。
  • 2025 年 2 月 5 日,宣布产品线全面上新,包括正式版 Gemini 2.0 Flash、Gemini 2.0 Flash - Lite 以及新一代旗舰大模型 Gemini 2.0 Pro 实验版等。

模型特点

  • 多模态能力强:能够理解和处理文本、图像、音频、视频等多种输入类型,并支持原生图像和多语言音频输出,还可集成谷歌搜索、代码执行以及第三方用户定义函数等工具。
  • 上下文窗口大:如 Gemini 2.0 Flash 能处理多达 100 万 tokens 的上下文窗口,Gemini 2.0 Pro 实验版有 200 万 tokens 的超长上下文窗口。
  • 性能表现优:Gemini Ultra 在 MMLU(大规模多任务语言理解数据集)中的得分率高达 90.0%,首次超越了人类专家。Gemini 2.0 Pro 实验版在通用、代码、推理、多模态、数学、长文本、图像、音视频等 13 项测试中,在 Gemini 系列中取得 11 个第一名。
  • 安全评估全面:应用对抗性测试技术,依据 AI 原则和严格的产品安全政策,增加新保护措施,与外部专家合作进行压力测试,建立安全分类器识别和过滤有害内容。

模型版本

  • Gemini Ultra:能力最强,可在各种高度复杂的任务中提供先进的性能,包括推理和多模态任务。
  • Gemini Pro:适用于多任务,在成本和延迟方面进行了性能优化,具有推理功能和广泛的多模态能力。
  • Gemini Nano:最高效的模型,用于特定任务和移动设备,训练了针对低内存和高内存器件的两个版本,参数分别为 1.8B(Nano - 1)和 3.25B(Nano - 2)。
  • Gemini 2.0 Flash:适用于大规模、高容量、高频率的任务,拥有多模态推理能力,支持多模态输入和文本单模态输出。
  • Gemini 2.0 Flash - Lite:被称为 “迄今为止最具成本效益的模型”,每输入一百万 tokens 的费用仅为 7.5 美分,具备 100 万 tokens 的上下文窗口并支持多模态输入。
  • Gemini 2.0 Flash Thinking:推理模型,以 Gemini 2.0 Flash 的速度和性能作为原型,经过训练后可将指令分解成一系列步骤,以加强推理能力并提供更好的反应,目前只支持文本和图片输入。

应用领域

  • 智能客服:构建智能客服系统,自动回答用户问题,提供更人性化的交互体验,处理更广泛和复杂的查询。
  • 内容创作:帮助内容创作者进行文本生成,如写作故事、诗歌、新闻报道等,还支持多语言翻译和文本摘要提取。
  • 金融领域:用于金融领域的数据分析和风险控制,帮助企业做出更准确的决策。
  • 医疗领域:可用于医疗领域的文本分析和诊断辅助,自动分析医疗文献和病历,为医生提供诊断支持。
  • 教育领域:用于教育领域的知识问答和智能评估,为学生提供个性化的学习资源和评估反馈。
  • 搜索引擎:利用机器学习技术,更快速、准确地搜索信息,提供更精准的搜索结果和个性化推荐内容。

相关导航

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注