Google I/O 2025 條列 AI 重點 (包含官方文章連結)

前言

前兩天是 Google I/O 2025，一年一度的網路開發者年會。

這次 Google 開大絕，公布了超多東西 (真的很多)，光是跟 AI 有相關的，快有 50 項了吧！

以下我整理並條列出簡短說明，以及附上官方介紹文章連結，讓有興趣的可以連過去看個仔細。

Veo 3：新一代影片生成模型，具備 “聲音” 輸出，可生成背景音效和口白 (角色對話、動物叫聲等)
Imagen 4：新一代影像生成模型，注重圖像細節 (高達 2K 解析度)、文字和排版，之後將推出快速版本，其速度比 Imagen 3 快 10 倍
Lyria 2：音樂生成模型，將整合至 YouTube Shorts、Vertex AI、Music AI Sandbox 平台
Lyria RealTime：互動式音樂生成模型，可讓任何人以即時互動方式創作、控制和演奏音樂
🏷️ Fuel your creativity with new generative media models and tools
🏷️ Expanding Vertex AI with the next wave of generative AI media models
Flow：結合 Veo、Imagen、Gemini 功能，整合在一起的 AI 電影製作工具
🏷️ Meet Flow: AI-powered filmmaking with Veo 3

✨

✨

✨

Gemini 2.5 Pro 和 2.5 Flash 增加「原生音訊輸出」新功能
開始測試「Deep Think」的增強推理模式，分數提高不少
更新 Gemini 2.5 Flash，幾乎在各面向都有提升，而且更加高效
本機 SDK 支援 MCP 協定
Gemini API 的 Native Audio Output & Live API：加入主動視訊、主動音訊、情感對話
Gemini API 加入原生音訊對話：使用新 Gemini 2.5 Flash 和 2.5 Pro 文字轉語音 (TTS) 功能
Gemini API 加入 URL context：模型可從網址擷取內容
Gemini API 加入 Music generation：使用 Lyria RealTime 生成音樂
Gemini API 加入 Asynchronous Function Calling：允許在背景呼叫運行時間較長的函數或工具，而不會阻塞主對話流
Computer Use API：瀏覽網頁或使用其他軟體工具
🏷️ Gemini 2.5: Our most intelligent models are getting even better
🏷️ Building with AI: highlights for developers at Google I/O

✨

Google AI Studio 升級：加入 Gemini speech generation、Lyria RealTime
🏷️ An upgraded dev experience in Google AI Studio

✨

✨

NotebookLM 加入 Video Overviews：生成包含圖片、插圖、文字說明的簡報影片，搭配自然流暢的人聲旁白
🏷️ Understand all the I/O news with NotebookLM.
Gemini Live 融入 Project Astra 的技術，透過視覺互動進行提問互動，可在 Android 和 iOS 上免費使用
升級 Project Mariner：AI agent，可同時處理 10 項不同的任務
🏷️ Our vision for building a universal AI assistant ( 中文版 )

✨

「Google AI Ultra」高階方案：每月 249.99 美元
「Google AI Pro」方案：每月 19.99 美元，就是現有的「AI Premium」更名
🏷️ Introducing Google AI Ultra: The best of Google AI in one subscription

✨

全新 Gemma 3n 模型，採用新架構，可輸入文字、影像、音訊，行動裝置優先
🏷️ Announcing Gemma 3n preview: powerful, efficient, mobile-first AI
🏷️ Gemma 3n model overview
Gemini Diffusion 文字擴散模型：聲稱性能與 Gemini 2.0 Flash-Lite 相似，但速度快五倍 (當前商業的文字擴散模型應該只有 Inception Mercury )
🏷️ Gemini Diffusion is our new experimental research model.
LearnLM 融入 Gemini 2.5：專屬任務模型，針對教學用途進行訓練
🏷️ Learn in newer, deeper ways with Gemini
SignGemma 手語模型：將手語翻譯成口語文本的模型
MedGemma 醫學模型：針對醫學文字和圖像理解的開放模型
🏷️ What you should know from the Google I/O 2025 Developer keynote

✨

個人版和 GitHub 版 Gemini Code Assist 已全面上市
🏷️ Coding with Gemini just got easier
Jules：非同步、代理程式編碼助手，與現有的儲存庫整合，進入公測階段，向所有人開放
🏷️ Build with Jules, your asynchronous coding agent
Stitch：透過自然語言和圖像，產生 UI 設計和前端程式碼
🏷️ From idea to app: Introducing Stitch, a new way to design UIs
Colab：全新、重新構想的 AI-first Google Colab
🏷️ Fully Reimagined: AI-First Google Colab
Google Beam (原名 Project Starline)：突破性 3D 視訊通訊平台，將 2D 影片串流轉換為逼真的 3D 體驗
🏷️ Google Beam: Our AI-first 3D video communication platform
Sparkify：將問題轉換成簡短的動畫影片

✨

SynthID Detector：協助確定使用 Google AI 建立的圖像、音軌、影片、文字是否包含 SynthID 浮水印，甚至只是影像中的一個區塊
🏷️ SynthID Detector — a new portal to help identify AI-generated content ( 中文版 )

✨

Android XR 系統：以 Gemini 為核心，結合沉浸式 AI 應用
🏷️ A new look at how Android XR will bring Gemini to glasses and headsets ( 中文版 )

這次 Google 真的一次公布&推出非常多新產品與功能，除了以上連結，還可參考這篇官方文章：

如果對於生成式 AI 有興趣的讀者，記得追蹤『 IT空間』FB 粉專，才不會錯過最新的發文通知呦~🔔

🔻 如果覺得喜歡，歡迎在下方獎勵我 5 個讚~