智能應用

從圖像到音頻，Stability AI 的擴散模型將改變音樂製作的遊戲規則

Stability AI，一家主要以 AI 生成視覺效果而聞名的公司，推出 Stable Audio 的文字到音頻生成式 AI 平台。Stable Audio 使用的是一種擴散模型，與該公司受歡迎的圖像工具 Stable Diffusion 所使用的 AI 模型相同，但訓練的是音頻而非圖像，使用者可以使用它來生成歌曲或任何項目的背景音樂。

Hannah

18 Sep 2023 — 2 min read

Stability AI，以 AI 生成視覺效果而聞名的公司，推出 Stable Audio 的文字到音頻生成式 AI 平台。Stable Audio 使用的是一種擴散模型，與該公司受歡迎的圖像工具 Stable Diffusion 所使用的 AI 模型相同，但訓練的是音頻而非圖像，使用者可以使用它來生成歌曲或任何項目的背景音樂。

音頻擴散模型傾向於生成固定長度的音頻，這對音樂製作來說是一個問題，因為歌曲的長度可能會有所不同。Stability AI 的新平台允許用戶製作不同長度的聲音，這需要該公司在音樂上進行訓練，並添加有關歌曲開始和結束時間的文本元數據。

根據該公司的說法，它使用“由超過 800,000 個音頻文件組成的數據集進行訓練，這些文件包含音樂、音效和單一樂器的主幹音軌”，以及來自庫存音樂許可公司 AudioSparx 的文本元數據。該數據集代表了超過 19,500 小時的聲音。Stability AI 表示，通過與一家許可公司合作，它有權使用受版權保護的材料。

與其他生成式 AI 音頻平台一樣，Stable Audio 的潛在使用案例將主要用於製作Podcast或視頻的背景音樂，用以加快這些工作流程。Stability AI 也在去年宣布計劃擴展到音頻生成、視頻和 3D 圖像。

【設計師的 AI 秘笈】你適合哪一款生圖神器？🧠 五大工具一次比清楚！

「我只是想畫張圖，怎麼工具那麼多？」 Midjourney 好像很紅，ChatGPT 也能生圖，Stable Diffusion 又很複雜... 別擔心，這篇幫你快速搞懂：每款工具適合誰、擅長什麼，一看就懂！

【科技新聞】一次看懂Meta 狂砸百億挖角 Apple！Zuckerberg 打造 AI 最強天團，開啟超級智慧軍火戰

你以為科技公司挖人只是日常？錯了，Meta最近這波操作根本是「開戰」！

Meta 正在「收購」OpenAI？只是用更狠毒的方式

上週大家過得還好嗎？這次丹娜絲颱風給台灣帶來的災情不小，南部和東部尤其嚴重。我的台南老家也被摧毀了，今天南下的高速公路充滿了倒掉的樹。寫這封週報的時候，其實心裡還掛著很多事，但還是想把這週值得關注的 AI 新聞整理好。希望大家都平安，也別忘了在忙碌之餘多多關心身邊的人。讓我們轉換心情！這週也一樣，精選 5 則值得關注的 AI 新聞，搭配一段觀察筆記，讓你不只是看熱鬧，也能看懂門道。本週焦點事件 1. Meta 正在「收購」OpenAI? 2. Google Veo 3 結束測試，全球開放！ 3. 針對 300 位軟體高層做的調查報告，揭露 AI 軟體公司的新成長曲線 4. Spotify 爆紅神秘樂團，其實是 AI 生的？ 5. AI 幫助一對夫妻成功懷孕？

【科技新聞】Google Search 正在消失？新創搶先佈局「AI 搜尋優化」藍海

面對 ChatGPT、Perplexity 改變搜尋習慣，AI 搜尋優化新創爆發式崛起，取代傳統 SEO，搶占未來品牌曝光戰場！

Read more

【設計師的 AI 秘笈】你適合哪一款生圖神器？🧠 五大工具一次比清楚！

【科技新聞】一次看懂Meta 狂砸百億挖角 Apple！Zuckerberg 打造 AI 最強天團，開啟超級智慧軍火戰

Meta 正在「收購」OpenAI？只是用更狠毒的方式

【科技新聞】Google Search 正在消失？新創搶先佈局「AI 搜尋優化」藍海