前言
前兩天是 Google I/O 2025,一年一度的網路開發者年會。
這次 Google 開大絕,公布了超多東西 (真的很多),光是跟 AI 有相關的,快有 50 項了吧!
以下我整理並條列出簡短說明,以及附上官方介紹文章連結,讓有興趣的可以連過去看個仔細。

Google I/O 條列重點
- Veo 3:新一代影片生成模型,具備 “聲音” 輸出,可生成背景音效和口白 (角色對話、動物叫聲等)
- Imagen 4:新一代影像生成模型,注重圖像細節 (高達 2K 解析度)、文字和排版,之後將推出快速版本,其速度比 Imagen 3 快 10 倍
- Lyria 2:音樂生成模型,將整合至 YouTube Shorts、Vertex AI、Music AI Sandbox 平台
- Lyria RealTime:互動式音樂生成模型,可讓任何人以即時互動方式創作、控制和演奏音樂
🏷️ Fuel your creativity with new generative media models and tools
🏷️ Expanding Vertex AI with the next wave of generative AI media models - Flow:結合 Veo、Imagen、Gemini 功能,整合在一起的 AI 電影製作工具
🏷️ Meet Flow: AI-powered filmmaking with Veo 3
✨
- 持續將 AI 引入 Workspace,包括 Gmail、Meet、Vids、Docs 中的新功能
🏷️ New ways Workspace with Gemini helps you do your best work — every day- Gmail 個人化智慧回覆
- Google Meet 加入即時語音翻譯,並保留您的聲音、語調和表情
- Google Vids 將現有的 Google 幻燈片轉換為引人入勝的影片,與自動轉錄修剪
- Google Docs 引入「以資料來源為基礎」的寫作協助功能
✨
- Gemini 代理模式 (Agent Mode):賦予執行任務與操作網頁
- Deep Research:可以加入自己上傳的 PDF 和圖像,研究報告就可以結合公共資訊和您提供的詳細資訊
- Canvas:更加直覺和強大,建立互動式網頁、資訊圖表、測驗、Podcast 風格的音訊概覽
- Chrome 整合進 Gemini
🏷️ Gemini gets more personal, proactive and powerful ( 中文版 )
✨
- Gemini 2.5 Pro 和 2.5 Flash 增加「原生音訊輸出」新功能
- 開始測試「Deep Think」的增強推理模式,分數提高不少
- 更新 Gemini 2.5 Flash,幾乎在各面向都有提升,而且更加高效
- 本機 SDK 支援 MCP 協定
- Gemini API 的 Native Audio Output & Live API:加入主動視訊、主動音訊、情感對話
- Gemini API 加入 原生音訊對話:使用新 Gemini 2.5 Flash 和 2.5 Pro 文字轉語音 (TTS) 功能
- Gemini API 加入 URL context:模型可從網址擷取內容
- Gemini API 加入 Music generation:使用 Lyria RealTime 生成音樂
- Gemini API 加入 Asynchronous Function Calling:允許在背景呼叫運行時間較長的函數或工具,而不會阻塞主對話流
- Computer Use API:瀏覽網頁或使用其他軟體工具
🏷️ Gemini 2.5: Our most intelligent models are getting even better
🏷️ Building with AI: highlights for developers at Google I/O
✨
- Google AI Studio 升級:加入 Gemini speech generation、Lyria RealTime
🏷️ An upgraded dev experience in Google AI Studio
✨
- AI Overviews:已在 200 多個國家(包含台灣)提供,支援 40 多種語言(包含中文)
🏷️ AI Overviews are now available in over 200 countries and territories, and more than 40 languages.
🏷️ Generative AI in Search: Let Google do the searching for you - AI Mode 搜尋功能:在美國全面推出
🏷️ AI in Search: Going beyond information to intelligence ( 中文版 ) - 透過 AI Mode 尋找想要的商品,並追蹤價格
- 新的「試穿」功能
🏷️ Shop with AI Mode, use AI to buy and try clothes on yourself virtually ( 中文版 )
🏷️ Here’s how to use Google’s new “try it on” feature.
✨
- NotebookLM 加入 Video Overviews:生成包含圖片、插圖、文字說明的簡報影片,搭配自然流暢的人聲旁白
🏷️ Understand all the I/O news with NotebookLM. - Gemini Live 融入 Project Astra 的技術,透過視覺互動進行提問互動,可在 Android 和 iOS 上免費使用
- 升級 Project Mariner:AI agent,可同時處理 10 項不同的任務
🏷️ Our vision for building a universal AI assistant ( 中文版 )
✨
- 「Google AI Ultra」高階方案:每月 249.99 美元
- 「Google AI Pro」方案:每月 19.99 美元,就是現有的「AI Premium」更名
🏷️ Introducing Google AI Ultra: The best of Google AI in one subscription
✨
- 全新 Gemma 3n 模型,採用新架構,可輸入 文字、影像、音訊,行動裝置優先
🏷️ Announcing Gemma 3n preview: powerful, efficient, mobile-first AI
🏷️ Gemma 3n model overview - Gemini Diffusion 文字擴散模型:聲稱性能與 Gemini 2.0 Flash-Lite 相似,但速度快五倍 (當前商業的文字擴散模型應該只有 Inception Mercury
)
🏷️ Gemini Diffusion is our new experimental research model. - LearnLM 融入 Gemini 2.5:專屬任務模型,針對教學用途進行訓練
🏷️ Learn in newer, deeper ways with Gemini - SignGemma 手語模型:將手語翻譯成口語文本的模型
- MedGemma 醫學模型:針對醫學文字和圖像理解的開放模型
🏷️ What you should know from the Google I/O 2025 Developer keynote
✨
- 個人版和 GitHub 版 Gemini Code Assist 已全面上市
🏷️ Coding with Gemini just got easier - Jules:非同步、代理程式編碼助手,與現有的儲存庫整合,進入公測階段,向所有人開放
🏷️ Build with Jules, your asynchronous coding agent - Stitch:透過自然語言和圖像,產生 UI 設計和前端程式碼
🏷️ From idea to app: Introducing Stitch, a new way to design UIs - Colab:全新、重新構想的 AI-first Google Colab
🏷️ Fully Reimagined: AI-First Google Colab - Google Beam (原名 Project Starline):突破性 3D 視訊通訊平台,將 2D 影片串流轉換為逼真的 3D 體驗
🏷️ Google Beam: Our AI-first 3D video communication platform - Sparkify:將問題轉換成簡短的動畫影片
✨
- SynthID Detector:協助確定使用 Google AI 建立的 圖像、音軌、影片、文字 是否包含 SynthID 浮水印,甚至只是影像中的一個區塊
🏷️ SynthID Detector — a new portal to help identify AI-generated content ( 中文版 )
✨
- Android XR 系統:以 Gemini 為核心,結合沉浸式 AI 應用
🏷️ A new look at how Android XR will bring Gemini to glasses and headsets ( 中文版 )
結語
這次 Google 真的一次公布&推出非常多新產品與功能,除了以上連結,還可參考這篇官方文章:
如果對於 生成式 AI 有興趣的讀者,記得追蹤『 IT空間 』FB 粉專,才不會錯過最新的發文通知呦~🔔
參考:
Google I/O 2025 官方部落格
100 things we announced at I/O
Google for Developers Blog
🔻 如果覺得喜歡,歡迎在下方獎勵我 5 個讚~