谷歌发布史上最强AI模型Gemini 2.0，明年初将拓展应用

快科技于今日（12月12日）传来消息，谷歌正式对外发布了专为新智能体时代打造的下一代模型——Gemini 2.0。

Gemini 2.0相关展示图片1

作为谷歌截至目前功能最为强大的AI模型，Gemini 2.0展现出了更为卓越的性能、丰富的多模态表现（例如具备原生图像和音频输出功能）以及全新的原生工具应用。

在关键基准测试里，Gemini 2.0相较于前代产品Gemini 1.5 Pro实现了性能的显著提升，运行速度甚至达到了后者的两倍之多。

它支持图像、视频和音频等多模态的输入与输出，例如能够实现与文本混合的原生文生图功能，还可以生成可自定义的文本转语音（TTS）多语言音频内容。

除此之外，Gemini 2.0还支持原生调用工具，像Google搜索、代码执行以及第三方用户定义函数等，为用户带来了更加便捷、强大的使用体验。

从技术层面来看，Gemini 2.0采用了最新的机器学习和深度学习算法，优化了神经网络的结构，提升了运行效率，尤其在自然语言处理（NLP）领域表现十分突出。

这些技术创新让Gemini 2.0能够更精准地理解和生成自然语言，极大地增强了人机交互的智能性。

Gemini 2.0相关展示图片2

从即日起，开发人员可以在AI Studio和Vertex AI中对Gemini 2.0 Flash实验版本进行试用。并且，该版本已经在网页版中为Gemini Advanced开放试用，移动版也将在后续推出。

为了助力开发者构建动态且交互式的应用程序，谷歌还发布了全新的Multimodal Live API，它具备实时音频、视频流输入以及使用多个组合工具的能力。

到明年年初，Gemini 2.0还会在更多Google产品中得以应用。

游戏资讯News