快科技于今日(12月12日)传来消息,谷歌正式对外发布了专为新智能体时代打造的下一代模型——Gemini 2.0。

作为谷歌截至目前功能最为强大的AI模型,Gemini 2.0展现出了更为卓越的性能、丰富的多模态表现(例如具备原生图像和音频输出功能)以及全新的原生工具应用。
在关键基准测试里,Gemini 2.0相较于前代产品Gemini 1.5 Pro实现了性能的显著提升,运行速度甚至达到了后者的两倍之多。
它支持图像、视频和音频等多模态的输入与输出,例如能够实现与文本混合的原生文生图功能,还可以生成可自定义的文本转语音(TTS)多语言音频内容。
除此之外,Gemini 2.0还支持原生调用工具,像Google搜索、代码执行以及第三方用户定义函数等,为用户带来了更加便捷、强大的使用体验。
从技术层面来看,Gemini 2.0采用了最新的机器学习和深度学习算法,优化了神经网络的结构,提升了运行效率,尤其在自然语言处理(NLP)领域表现十分突出。
这些技术创新让Gemini 2.0能够更精准地理解和生成自然语言,极大地增强了人机交互的智能性。

从即日起,开发人员可以在AI Studio和Vertex AI中对Gemini 2.0 Flash实验版本进行试用。并且,该版本已经在网页版中为Gemini Advanced开放试用,移动版也将在后续推出。
为了助力开发者构建动态且交互式的应用程序,谷歌还发布了全新的Multimodal Live API,它具备实时音频、视频流输入以及使用多个组合工具的能力。
到明年年初,Gemini 2.0还会在更多Google产品中得以应用。


























