[好書推薦]《AI工具使用手冊：學會AI魔法讓你變身超人不再當麻瓜》

前言

為什麼要特別推薦它呢？
原因很簡單，因為我是其中一位作者~~~ www (灑花🎉

從兩年前(2022年)的 11 月 OpenAI 推出 ChatGPT 開始，後續類似生成式 AI 聊天產品如雨後春筍般相繼推出，例如 Google 的 Gemini、微軟的 Bing Copilot，生成式 AI 的熱潮被帶了起來 ✨。
不只侷限在最多人接觸到的 AI 聊天、問答，後續還有各式各樣的 AI 工具、服務、網站，例如圖片、影片、音樂……百花齊放。目前 AI 新服務出來的速度，不是用「月」在計算的，而是已經到了「週」，甚至「日」了，非常的快速。

本書 11 位作者都有接觸 AI 相關領域，不管是用在工作上、生活中、或興趣使然，合作整理出來 43 種目前常用的 AI 工具，全書採全彩印刷，另也有電子版供選擇哦~

書中共分成七大章節，分別為「聊天｜語言模型」、「圖片」、「影片」、「聲音」、「音樂」、「程式」、「其他」，也就是使用 AI 工具的用途來分類，每一個章節會挑出幾個代表性的工具來分享給大家。依照導言、功能概述、使用步驟、應用案例、優缺點、評分、常見問題解答、資源和支援的架構逐一介紹，並搭配實際使用案例、用法截圖方便讓各位讀者快速了解、認識各項 AI 工具。

博客來網路書店：
《AI工具使用手冊：學會AI魔法讓你變身超人不再當麻瓜》

倒上一杯卡布奇諾☕，我們開始吧~

各章節介紹

1. 🤖 聊天｜語言模型

不知道你第一次接觸到生成式 AI 是從哪個網站、哪個工具？
我想應該大部分的人都是從「與 AI 聊天」開始吧，像是 OpenAI 的 ChatGPT、Google 的 Gemini。

想必大家在與 AI 聊天的時候，或多或少都有發生過，AI 回覆不如你的意的情況吧。
那是不是 AI 模型太笨呢 (有可能)，或者是我們不太會「問」？

此章節除了講解如何操作之外，還針對該如何下 Prompt(提示詞) 有進一步的說明，例如可以使用「角色扮演」的技巧，並實際比較有使用與沒使用這個技巧的差異。

與生成式 AI 聊天有幾項優勢：

人性化的問答：可以使用一般口語問答，它能理解的問題，而且也能以人性化的口吻回答。有別於以前聊天機器人的呆板形象。
流暢的對話：生成式 AI 更能理解上下文，生成更連貫自然的回應。
多種語言：通常 AI 模型可以支持多種語言，對於需要提供給不同國家的使用者，會很有幫助。
具創造力：生成式 AI 可以有創作的元素，它可以幫你創作詩歌、程式碼、故事、電子郵件、文案等等，應用非常廣泛。
更廣泛的領域：不受特定領域知識的限制，它能夠進行更開放性的對話。

當然，目前的生成式 AI 聊天還存在一些問題，例如幻覺(不準確的資訊)、缺乏常識、隱私、濫用、歧視等等問題，不過透過不同的方法與研究，持續有在改善。

但瑕不掩瑜，生成式 AI 還是為我們帶來創新的可能性和實用價值。

延伸閱讀：
✨ ChatGPT 官網
✨ Gemini 官網
✨ Claude 官網

2. 🖼️ 圖片

「生成圖片」想必大家都有耳聞，或其實已經實際操作過。就算你美術很爛、畫畫只會火柴人，也可以透過生成式 AI 來協助你將天馬行空的想法繪製出來。

例如你想使用 ChatGPT 內的 DALL‧E，或更進階的 Midjourney，甚至想要在本地生成圖片可以用 Stable Diffusion，又或者你是設計師，Adobe 也有推出 Adobe Firefly 可搭配使用。

你可以用它來設計 Logo、網站、菜單，或創造自己專屬的頭像。
不管是想要奇幻風格、融合不同元素的圖片、藝術風格轉換(塗鴉、3D、紙雕、水彩)，甚至擬真攝影(指定光圈、景深、曝光)，它都有辦法做到。

當你需要圖片時，不再只能從免費&付費圖庫、聘請專業人員來獲得，也多了一種創作的管道。
可以說它打開了大眾創作圖片的大門。

延伸閱讀：
✨ OpenAI DALL·E 3 官網
✨ Midjourney 官網
✨ Stability AI 官網
✨ Adobe Firefly 官網
✨ 如何透過 AI 將自己的圖片變貼圖？（連續角色製作秘訣）

3. 🎞️ 影片

講到 AI「生成影片」，應該許多人第一個想到的是 OpenAI 的 Sora 模型，它能產生栩栩如生的影片。
雖然 Sora 還沒開放給大眾，但現在也有其他影片生成、編輯工具。像是在 HeyGen 創作虛擬替身，並讓影片中的人物嘴形隨著字幕變動；透過 Pika、DomoAI 文字生成影片、由圖片生成影片、將影片轉換為不同風格。其實已經誕生了許多工具與應用。

對於有社群短片、教育影片、新聞傳播、商業廣告等等的需求，在現在或不久的將來，都是很有機會可以做到的。像是前陣子，創作鬼才黃明志團隊就透過 AI 來製作歌曲 MV。

如同之前介紹 Sora 時說到，
在小型節目製作公司或 YouTuber 製作影片時，為了輔助說明內容，常會使用短片素材。但由於拍攝、製作成本的考量，他們可能會使用免費或付費影片素材庫的內容。不過，這些素材庫的影片可能無法完全符合需求，或是與其他人使用到一模一樣的影片素材。
而現在 AI 生成的影片品質看起來已經達到可以使用的程度，這對對影視產業來說是一大利器(或衝擊？)。

4. 🎤 聲音

「聲音」的章節指的是把我們的語音去做轉換，像是複製自己的聲音來做 TTS，或是產生不同風格、語氣的聲音。

相較以前的 TTS 技術，透過 AI 產生的結果會更加自然流暢，減少機器合成聲音的僵硬感。而且除了可以生成不同語言、口音、情緒以外，也可以模仿原始說話者的說話風格、音調等特點來訓練模型，製作出高度個人化的語音。

書中介紹到的 Voice AI、剪映、ElevenLabs 等等都有聲音這方面的功能。

應用在虛擬助手(例如 Google Assistant、Siri)、客服語音可以生成逼真和自然的聲音，應用在遊戲內角色說話也可以讓玩家帶入沉浸感，更加身臨其境和逼真。

還有對於有大量語音需求的產業，像是新聞、廣播、短影音，可以幫助他們大量快速生產語音內容、大幅減低成本

延伸閱讀：
✨ 半年估值翻10倍，a16z、紅杉都看好的AI新創：ElevenLabs
✨ AI 變聲器獲 1.8 億元募資，擁 50 萬用戶的 Voice.ai 為什麼成實況主神器？

5. 🎵 音樂

講到 AI「音樂」，絕對不能不提到 Suno，它將 AI 作曲變成可能，對於拿來製作流行音樂、背景音樂、配樂都足夠應付。
當然可以根據我們的需求，生成流行音樂、電子音樂、古典音樂等等不同種類，你想要什麼情緒、想要哪些歌詞、男聲還是女聲，甚至希望使用哪些樂器，也都可以對它下指示。

與影片生成類似，對於目前大量的影音內容創作者有不小的幫助。透過生成式 AI 產生音樂、配樂可以做出獨一無二的音樂素材，而且可能也降低不少成本，包括金錢與尋找合適音樂的時間。

延伸閱讀：
✨ Suno AI 作曲全球爆紅！幾個月前還覺得 AI 作曲是個笑話，現在覺得 AI 要霸榜熱曲也不是不可能了~ | PAPAYA 電腦教室
✨ 【SoundRAW AI作曲軟體教學】3分鐘AI生成音樂，還可同步播放影片微調曲子!

以上透過 AI 來「生成圖片、影片、聲音、音樂」有幾項優勢：

降低創作門檻：雖然說想要 AI 照你的想法生成，還是需要經過一段時間學習，但遠比自己學習繪圖、音樂知識來的快速。甚至一開始就算沒有關關基本知識，也可以很快產生成品，更容易有成就感。
提高創作效率：不像人工需要花費長時間創作，AI 幾秒鐘就可以將想法創造出來。
低成本：包括前面提到的學習成本與時間成本，甚至是人力，生成式 AI 都大幅減低不少成本。
個性化定制：可以根據你想要的風格、情緒、氛圍等等需求，生成對應的結果。
無限創意：雖然 AI 大多沒辦法將你的想法一模一樣的呈現出來，但這也更容易跳脫你的框架，創造出你從沒想過的想法。
風格多樣化：可以模仿並融合不同風格，創造出新穎、獨特的圖片、影片、音樂。
多樣化應用場景：不論是要用在廣告、網頁、產品、娛樂、教育等眾多領域，或是想要有不同風格都可以。

6. 💻 程式

「程式」的部分也是我比較常接觸到的，主要是針對程式開發者的工具。

像是之前有介紹過的 OpenAI API、Gemini API，透過 Python 串接 LLM 進來自己的應用、專案。如果需要更進一步深入的話，可以搭配我之前介紹過的 LLamaIndex 套件，搭建 RAG 架構。

除了串接 LLM，我們在做程式開發的時候，會使用到文字編輯器 (Visual Studio Code、Sublime Text)、IDE (Visual Studio、JetBrains)、Jupyter Notebook 之類的工具。在撰寫程式中，可能會用到自動補全、除錯的功能加速開發、減少錯誤。而現在 LLM 也可以引入到其中，進一步大幅提升功力，例如此書介紹的 Github Copilot、Codeium。

將生成式 AI 串接進程式中有以下優勢：