🗣️我如何讓虛擬人物說話?細節工具全公開!

因為非常多人問我們怎麼讓AI郵報IG上的矽谷小哥嘴巴動起來,同時嘴唇又能和所說的字完全同步,所以特別製作影片和詳解文,希望對AI有興趣的朋友都能夠在我們的幫助下學習讓虛擬人物說話!讓我們馬上開始吧!
目錄:
流程介紹

製作虛擬人像
首先第一步是先製作你喜歡的虛擬人物照片,這邊以免費的AI生圖機器人 DALLE3 做示範,要這個步驟要特別注意的是,虛擬人物的五官「一定要清楚」、「不能被瀏海或是眼鏡遮到」,否則同步嘴型的工具無法識別臉型,就無法產生「虛擬人物動嘴的影片」(就算能產生也會有眉毛眼睛亂動的畫面)
- 打開 Bing (Bing生圖是用DALLE3的模型)
- 打上 「 你想要的角色外觀+人臉要清楚」
- 儲存人物圖片
- 進入下步驟(如果想用自己的聲音,請直接到第三步驟D-ID)
創造虛擬人物的聲音(自行錄製或是文字轉語音)
第二步則是創造虛擬人物的聲音,如果你想用錄製你自己的聲音的話,可以跳過這個步驟,如果不想錄製的話,就要用到文字轉語音工具,當你打一段文字「你一定很常聽到這個聲音吧?」再透過這個工具,就能把這段文字變成講話的聲音。
在這步驟我選擇用「剪映」做(抖音母公司的產品),因為剪映提供的音色很多,其中有台灣男生的聲音,而且聽起來真的蠻「台灣」的。如果你不想下載軟體不要緊,你可以使用市面上文字轉語音的工具,如 TTS Maker,因為在這個步驟中我們只需要音檔即可,你自己說話也行。

剪映上有很多有趣的音色,許多中國的營銷號都是透過這些音色來量產影片。
- 打開剪映
- 左上方選擇文本,創建文本
- 輸入你想聽到的文字,例如說「你一定很常聽到這個聲音吧?」
- 選擇朗讀
- 挑選你喜歡的音色(有些真的很好笑,還能唱歌)
- 開始朗讀
- 播放,你就可以聽到聲音了
讓人像說話 ─ 同步嘴型
最後一步也是最簡單輕鬆的一步,就是到 D-ID 這個網站上傳你的虛擬人物圖片,這是一個透過 AI 模型識別人物的五官,再透過音檔同步嘴型,進而產生圖片在說話的工具,市面上有很多相同功能的工具,如HeyGen,但 HeyGen 強的地方在於真人,還有多國語言互轉,如果要用虛擬人物,使用 D-ID 會有更好的效果。
- 創建D-ID帳號(一開始他會給你 20 points,大約5分鐘的語音生成長度)
- 右上角Create Video
- 上傳你製作好的虛擬人物(如果顯示人物無法辨別,請重新回第一步驟)
- 點選 Audio (音訊生成)
- 上傳音檔
- 成功!下載影片