智能應用

從圖像到音頻，Stability AI 的擴散模型將改變音樂製作的遊戲規則

Stability AI，一家主要以 AI 生成視覺效果而聞名的公司，推出 Stable Audio 的文字到音頻生成式 AI 平台。Stable Audio 使用的是一種擴散模型，與該公司受歡迎的圖像工具 Stable Diffusion 所使用的 AI 模型相同，但訓練的是音頻而非圖像，使用者可以使用它來生成歌曲或任何項目的背景音樂。

Hannah

18 Sep 2023 — 2 min read

Stability AI，以 AI 生成視覺效果而聞名的公司，推出 Stable Audio 的文字到音頻生成式 AI 平台。Stable Audio 使用的是一種擴散模型，與該公司受歡迎的圖像工具 Stable Diffusion 所使用的 AI 模型相同，但訓練的是音頻而非圖像，使用者可以使用它來生成歌曲或任何項目的背景音樂。

音頻擴散模型傾向於生成固定長度的音頻，這對音樂製作來說是一個問題，因為歌曲的長度可能會有所不同。Stability AI 的新平台允許用戶製作不同長度的聲音，這需要該公司在音樂上進行訓練，並添加有關歌曲開始和結束時間的文本元數據。

根據該公司的說法，它使用“由超過 800,000 個音頻文件組成的數據集進行訓練，這些文件包含音樂、音效和單一樂器的主幹音軌”，以及來自庫存音樂許可公司 AudioSparx 的文本元數據。該數據集代表了超過 19,500 小時的聲音。Stability AI 表示，通過與一家許可公司合作，它有權使用受版權保護的材料。

與其他生成式 AI 音頻平台一樣，Stable Audio 的潛在使用案例將主要用於製作Podcast或視頻的背景音樂，用以加快這些工作流程。Stability AI 也在去年宣布計劃擴展到音頻生成、視頻和 3D 圖像。

Sora 2 怎麼用？邀請碼怎麼拿？完整申請教學一次看！

OpenAI 全新影片生成模型 Sora 2 正式上線，支援聲音、對話與「角色客串」功能。本篇教你如何用 VPN 在台灣開通 Sora App，註冊新帳號、領取邀請碼，並實測如何用 Cameos 把自己放進 AI 電影中。

[資源分享] OpenAI釋出Prompt免費懶人包！超過300個專業提示詞助力職場效率提升

還在為不知道如何對AI下達精確指令而煩惱嗎？OpenAI Academy近期重磅推出「Prompt Packs」免費資源包，一次性釋出超過300個針對不同職能設計的專業提示詞範例。這套官方認證的提示詞懶人包涵蓋業務、客戶關係管理、產品經理、工程師、人資、IT、管理團隊、高階主管、財務及行銷等11大領域，提供結構清晰、可直接套用的範本，讓使用者能夠顯著提升AI工具的使用效率和輸出品質。

【AI 新手包 #5 打造工具自動化】打造你的智能貼文管理系統：自動整理 + Slack/Email 通知完全指南

想像一下，你的社群媒體內容就像一間自動化工廠，從內容創作到發布通知，全程無需人工干預。本文將教你用 n8n 打造這樣的系統，讓你從「社群媒體奴隸」變成「自動化大師」。

日立與 OpenAI 合作股價飆 9.9%，帶動日經指數逼近歷史高點

OpenAI 與日本工業巨頭日立簽署合作備忘錄，延續其與韓國三星、SK Hynix 的合作，加速OpenAI在亞洲的布局。

Read more

Sora 2 怎麼用？邀請碼怎麼拿？完整申請教學一次看！

[資源分享] OpenAI釋出Prompt免費懶人包！超過300個專業提示詞助力職場效率提升

【AI 新手包 #5 打造工具自動化】打造你的智能貼文管理系統：自動整理 + Slack/Email 通知完全指南

日立與 OpenAI 合作股價飆 9.9%，帶動日經指數逼近歷史高點