請啟用JavaScript來查看內容

[好書推薦]《AI工具使用手冊:學會AI魔法讓你變身超人不再當麻瓜》

前言

AI工具使用手冊:學會AI魔法讓你變身超人不再當麻瓜 (圖片來源:博客來)
AI工具使用手冊:學會AI魔法讓你變身超人不再當麻瓜 (圖片來源:博客來)

今天要來推薦一本書《AI工具使用手冊:學會AI魔法讓你變身超人不再當麻瓜》

為什麼要特別推薦它呢?
原因很簡單,因為我是其中一位作者~~~ www (灑花🎉


從兩年前(2022年)的 11 月 OpenAI 推出 ChatGPT 開始,後續類似生成式 AI 聊天產品如雨後春筍般相繼推出,例如 Google 的 Gemini、微軟的 Bing Copilot,生成式 AI 的熱潮被帶了起來 ✨。
不只侷限在最多人接觸到的 AI 聊天、問答,後續還有各式各樣的 AI 工具、服務、網站,例如圖片、影片、音樂……百花齊放。目前 AI 新服務出來的速度,不是用「月」在計算的,而是已經到了「週」,甚至「日」了,非常的快速。



本書 11 位作者都有接觸 AI 相關領域,不管是用在工作上、生活中、或興趣使然,合作整理出來 43 種目前常用的 AI 工具,全書採全彩印刷,另也有電子版供選擇哦~

書中共分成七大章節,分別為「聊天|語言模型」、「圖片」、「影片」、「聲音」、「音樂」、「程式」、「其他」,也就是使用 AI 工具的用途來分類,每一個章節會挑出幾個代表性的工具來分享給大家。依照 導言、功能概述、使用步驟、應用案例、優缺點、評分、常見問題解答、資源和支援 的架構逐一介紹,並搭配實際使用案例、用法截圖方便讓各位讀者快速了解、認識各項 AI 工具。




倒上一杯卡布奇諾☕,我們開始吧~


各章節介紹

1. 🤖 聊天|語言模型

不知道你第一次接觸到生成式 AI 是從哪個網站、哪個工具?
我想應該大部分的人都是從「與 AI 聊天」開始吧,像是 OpenAI 的 ChatGPT、Google 的 Gemini。

想必大家在與 AI 聊天的時候,或多或少都有發生過,AI 回覆不如你的意的情況吧。
那是不是 AI 模型太笨呢 (有可能),或者是我們不太會「問」?

此章節除了講解如何操作之外,還針對該如何下 Prompt(提示詞) 有進一步的說明,例如可以使用「角色扮演」的技巧,並實際比較有使用與沒使用這個技巧的差異。


與生成式 AI 聊天有幾項優勢:

  • 人性化的問答:可以使用一般口語問答,它能理解的問題,而且也能以人性化的口吻回答。有別於以前聊天機器人的呆板形象。
  • 流暢的對話:生成式 AI 更能理解上下文,生成更連貫自然的回應。
  • 多種語言:通常 AI 模型可以支持多種語言,對於需要提供給不同國家的使用者,會很有幫助。
  • 具創造力:生成式 AI 可以有創作的元素,它可以幫你創作詩歌、程式碼、故事、電子郵件、文案等等,應用非常廣泛。
  • 更廣泛的領域:不受特定領域知識的限制,它能夠進行更開放性的對話。

當然,目前的生成式 AI 聊天還存在一些問題,例如幻覺(不準確的資訊)、缺乏常識、隱私、濫用、歧視等等問題,不過透過不同的方法與研究,持續有在改善。

但瑕不掩瑜,生成式 AI 還是為我們帶來創新的可能性和實用價值。


聊天|語言模型 章節 — ChatGPT、Gemini
聊天|語言模型 章節 — ChatGPT、Gemini

延伸閱讀:
ChatGPT 官網
Gemini 官網
Claude 官網


2. 🖼️ 圖片

「生成圖片」想必大家都有耳聞,或其實已經實際操作過。就算你美術很爛、畫畫只會火柴人,也可以透過生成式 AI 來協助你將天馬行空的想法繪製出來。

例如你想使用 ChatGPT 內的 DALL‧E,或更進階的 Midjourney,甚至想要在本地生成圖片可以用 Stable Diffusion,又或者你是設計師,Adobe 也有推出 Adobe Firefly 可搭配使用。


你可以用它來設計 Logo、網站、菜單,或創造自己專屬的頭像。
不管是想要奇幻風格、融合不同元素的圖片、藝術風格轉換(塗鴉、3D、紙雕、水彩),甚至擬真攝影(指定光圈、景深、曝光),它都有辦法做到。

當你需要圖片時,不再只能從免費&付費圖庫、聘請專業人員來獲得,也多了一種創作的管道。
可以說它打開了大眾創作圖片的大門。


圖片 章節 — DALL‧E、Adobe Firefly
圖片 章節 — DALL‧E、Adobe Firefly

延伸閱讀:
OpenAI DALL·E 3 官網
Midjourney 官網
Stability AI 官網
Adobe Firefly 官網
如何透過 AI 將自己的圖片變貼圖?(連續角色製作秘訣)


3. 🎞️ 影片

講到 AI「生成影片」,應該許多人第一個想到的是 OpenAI 的 Sora 模型,它能產生栩栩如生的影片。
雖然 Sora 還沒開放給大眾,但現在也有其他影片生成、編輯工具。像是在 HeyGen 創作虛擬替身,並讓影片中的人物嘴形隨著字幕變動;透過 Pika、DomoAI 文字生成影片、由圖片生成影片、將影片轉換為不同風格。其實已經誕生了許多工具與應用。


對於有社群短片、教育影片、新聞傳播、商業廣告等等的需求,在現在或不久的將來,都是很有機會可以做到的。像是前陣子,創作鬼才黃明志團隊就透過 AI 來製作歌曲 MV。

如同之前介紹 Sora 時說到,
在小型節目製作公司或 YouTuber 製作影片時,為了輔助說明內容,常會使用短片素材。但由於拍攝、製作成本的考量,他們可能會使用免費或付費影片素材庫的內容。不過,這些素材庫的影片可能無法完全符合需求,或是與其他人使用到一模一樣的影片素材。
而現在 AI 生成的影片品質看起來已經達到可以使用的程度,這對對影視產業來說是一大利器(或衝擊?)。


影片 章節 — HeyGen、Sora
影片 章節 — HeyGen、Sora

延伸閱讀:
更多 OpenAI 的 Sora 模型可以做的事,文字轉影片 AI
黃明志只花600元拍MV 超驚人震撼畫面曝光
HeyGen 詳細教學:用 AI 打造自己造型的虛擬主播,支援多國語言翻譯


4. 🎤 聲音

「聲音」的章節指的是把我們的語音去做轉換,像是複製自己的聲音來做 TTS,或是產生不同風格、語氣的聲音。

相較以前的 TTS 技術,透過 AI 產生的結果會更加自然流暢,減少機器合成聲音的僵硬感。而且除了可以生成不同語言、口音、情緒以外,也可以模仿原始說話者的說話風格、音調等特點來訓練模型,製作出高度個人化的語音。

書中介紹到的 Voice AI、剪映、ElevenLabs 等等都有聲音這方面的功能。


應用在虛擬助手(例如 Google Assistant、Siri)、客服語音可以生成逼真和自然的聲音,應用在遊戲內角色說話也可以讓玩家帶入沉浸感,更加身臨其境和逼真。

還有對於有大量語音需求的產業,像是新聞、廣播、短影音,可以幫助他們大量快速生產語音內容、大幅減低成本


聲音 章節 — Voice AI、ElevenLabs
聲音 章節 — Voice AI、ElevenLabs

延伸閱讀:
半年估值翻10倍,a16z、紅杉都看好的AI新創:ElevenLabs
AI 變聲器獲 1.8 億元募資,擁 50 萬用戶的 Voice.ai 為什麼成實況主神器?


5. 🎵 音樂

講到 AI「音樂」,絕對不能不提到 Suno,它將 AI 作曲變成可能,對於拿來製作流行音樂、背景音樂、配樂都足夠應付。
當然可以根據我們的需求,生成流行音樂、電子音樂、古典音樂等等不同種類,你想要什麼情緒、想要哪些歌詞、男聲還是女聲,甚至希望使用哪些樂器,也都可以對它下指示。


與影片生成類似,對於目前大量的影音內容創作者有不小的幫助。透過生成式 AI 產生音樂、配樂可以做出獨一無二的音樂素材,而且可能也降低不少成本,包括金錢與尋找合適音樂的時間。


音樂 章節 — Soundraw.io、Suno
音樂 章節 — Soundraw.io、Suno

延伸閱讀:
Suno AI 作曲全球爆紅!幾個月前還覺得 AI 作曲是個笑話,現在覺得 AI 要霸榜熱曲也不是不可能了~ | PAPAYA 電腦教室
【SoundRAW AI作曲軟體教學】3分鐘AI生成音樂,還可同步播放影片微調曲子!




以上透過 AI 來「生成圖片、影片、聲音、音樂」有幾項優勢:

  • 降低創作門檻:雖然說想要 AI 照你的想法生成,還是需要經過一段時間學習,但遠比自己學習繪圖、音樂知識來的快速。甚至一開始就算沒有關關基本知識,也可以很快產生成品,更容易有成就感。
  • 提高創作效率:不像人工需要花費長時間創作,AI 幾秒鐘就可以將想法創造出來。
  • 低成本:包括前面提到的學習成本與時間成本,甚至是人力,生成式 AI 都大幅減低不少成本。
  • 個性化定制:可以根據你想要的風格、情緒、氛圍等等需求,生成對應的結果。
  • 無限創意:雖然 AI 大多沒辦法將你的想法一模一樣的呈現出來,但這也更容易跳脫你的框架,創造出你從沒想過的想法。
  • 風格多樣化:可以模仿並融合不同風格,創造出新穎、獨特的圖片、影片、音樂。
  • 多樣化應用場景:不論是要用在廣告、網頁、產品、娛樂、教育等眾多領域,或是想要有不同風格都可以。


6. 💻 程式

「程式」的部分也是我比較常接觸到的,主要是針對程式開發者的工具。

像是之前有介紹過的 OpenAI API、Gemini API,透過 Python 串接 LLM 進來自己的應用、專案。如果需要更進一步深入的話,可以搭配我之前介紹過的 LLamaIndex 套件,搭建 RAG 架構。

除了串接 LLM,我們在做程式開發的時候,會使用到文字編輯器 (Visual Studio Code、Sublime Text)、IDE (Visual Studio、JetBrains)、Jupyter Notebook 之類的工具。在撰寫程式中,可能會用到自動補全、除錯的功能加速開發、減少錯誤。而現在 LLM 也可以引入到其中,進一步大幅提升功力,例如此書介紹的 Github Copilot、Codeium。


將生成式 AI 串接進程式中有以下優勢:

  • 內容生成:生成式 AI 的專長,將內容生成應用進自己的專案中。
  • 自然語言處理:可提升聊天機器人、語音助理、客戶服務等等的人機互動體驗。
  • 數據增量:在有些場合(機器學習任務)需要大量的訓練資料,就可以透過生成式 AI 來幫你產生。
  • 個性化體驗:生成式 AI 可以根據用戶的喜好和背景訊息,生成高度個性化的內容,帶來更佳的產品和服務體驗。
  • 提高開發效率:生成式 AI 可協助開發時的自動生成程式碼、除錯、重構,節省開發人員的時間和精力。
  • 提升程式碼品質:可協助開發人員產出更優質的程式碼,對於程式碼的可維護性和性能也有幫助。

程式 章節 — LangChain、Gemini API
程式 章節 — LangChain、Gemini API
程式 章節 — Github Copilot、Langflow
程式 章節 — Github Copilot、Langflow

延伸閱讀:
LangChain 官網
Github Copilot 官網
Codeium 官網
如何使用 Google 的 Gemini 模型 API?(基礎教學,附上 Python 範例程式)
OpenAI ChatGPT API 如何使用?(附上 Python 範例程式)
使用 RAG 打造個人知識庫,LlamaIndex 搭配 Gemini 模型


7. 📂 其他

除了以上的六種類別以外,其他篇幅比較少不能獨立出一個章節的,我們就把它歸類在這裡。

像是最強的 AI 簡報製作—Gamma,或者是可以串聯不同應用、實現流程自動化的 Zapier,又或者是協助會議逐字稿與筆記整理的 SeaMeet,全都在這個章節裡面。
學會運用它們,對於工作、日常瑣事絕對也會產生不小的幫助。


其他 章節 — Gamma、Zapier
其他 章節 — Gamma、Zapier

延伸閱讀:
Gamma 教學|AI 簡報工具一鍵完成報告、網頁設計、排版配圖
支援6,000個軟體、估值50億,工作流程自動化巨人Zapier做對的3件事
Google Meet 內建會議中文字幕 與 SeaMeet 會議助手實測比較 中文逐字稿 摘要 | SeaMeet


結語

以上我都只是稍微提到幾項 AI 工具,書中還有更多其他工具與更詳細的說明。
對於 AI 方面感興趣的讀者,都歡迎購買、借閱本書來詳讀,一定會有不少收穫~

隨著未來技術發展,我們可以預期在未來幾年看到「生成式 AI」技術的更多應用。
希望藉由本書或我的部落格,可以引起你對於這領域的好奇,進而運用到日常生活、工作、學習中,提升自己的技能、創造力、效率。


「你準備好迎接生成式 AI 的時代了嗎?」
讓我們一起探索這個令人興奮的領域吧~




如果對於 生成式 AI 有興趣的讀者,記得追蹤『IT空間』FB 粉專,才不會錯過最新的發文通知呦~🔔




這本AI工具使用手冊,未來會是如同Word使用手冊一樣-如果不是人手一本必讀必學,就是人們都已經掌握而不需要閱讀,而我相信現在是你入手,早一步成為後者的最佳時機

—— 文案專家 林育聖


🔻 如果覺得喜歡,歡迎在下方獎勵我 5 個讚~
分享

Jia
作者
Jia
軟體工程師