從圖像到音頻,Stability AI 的擴散模型將改變音樂製作的遊戲規則

Stability AI,一家主要以 AI 生成視覺效果而聞名的公司,推出 Stable Audio 的文字到音頻生成式 AI 平台。Stable Audio 使用的是一種擴散模型,與該公司受歡迎的圖像工具 Stable Diffusion 所使用的 AI 模型相同,但訓練的是音頻而非圖像,使用者可以使用它來生成歌曲或任何項目的背景音樂。

從圖像到音頻,Stability AI 的擴散模型將改變音樂製作的遊戲規則

Stability AI,以 AI 生成視覺效果而聞名的公司,推出 Stable Audio 的文字到音頻生成式 AI 平台。Stable Audio 使用的是一種擴散模型,與該公司受歡迎的圖像工具 Stable Diffusion 所使用的 AI 模型相同,但訓練的是音頻而非圖像,使用者可以使用它來生成歌曲或任何項目的背景音樂。

音頻擴散模型傾向於生成固定長度的音頻,這對音樂製作來說是一個問題,因為歌曲的長度可能會有所不同。Stability AI 的新平台允許用戶製作不同長度的聲音,這需要該公司在音樂上進行訓練,並添加有關歌曲開始和結束時間的文本元數據。

根據該公司的說法,它使用“由超過 800,000 個音頻文件組成的數據集進行訓練,這些文件包含音樂、音效和單一樂器的主幹音軌”,以及來自庫存音樂許可公司 AudioSparx 的文本元數據。該數據集代表了超過 19,500 小時的聲音。Stability AI 表示,通過與一家許可公司合作,它有權使用受版權保護的材料。

與其他生成式 AI 音頻平台一樣,Stable Audio 的潛在使用案例將主要用於製作Podcast或視頻的背景音樂,用以加快這些工作流程。Stability AI 也在去年宣布計劃擴展到音頻生成、視頻和 3D 圖像。

Read more

【設計師的 AI 秘笈】程式小白也能懂!用 Cursor 從零搭建專屬 Design System Skill,讓 AI 自動寫出完美 UI

【設計師的 AI 秘笈】程式小白也能懂!用 Cursor 從零搭建專屬 Design System Skill,讓 AI 自動寫出完美 UI

每次請 AI 寫網頁代碼,UI 的顏色和間距總是像「抽盲盒」一樣難以預測?其實,你只需要幫 AI 建立一份「專屬設計說明書」。這篇文章專為非程式背景的設計師與 PM 打造,將透過 3 個簡單步驟,教你如何利用 Cursor 的「Design System Skill 」,讓 AI 牢牢記住你的 Material Design 或 Figma 設計規範。告別反覆來回修改的痛點,新手也能讓 AI 一鍵產出完美對齊設計稿的網頁組件!

lock-1
Google Stitch 重大更新:5大升級讓「Vibe Design」成為 AI 設計新典範

Google Stitch 重大更新:5大升級讓「Vibe Design」成為 AI 設計新典範

Google 旗下實驗性 AI 設計工具 Stitch 於 2026 年 3 月 18 日迎來史上最大規模更新,正式進化為「AI 原生設計畫布(AI-Native Canvas)」。這次更新不僅是功能擴充,更是對整個設計流程的重新定義。Google 將這套理念稱為「Vibe Design(氛圍設計)」,讓任何人不需手動繪製線框稿,只要用自然語言描述想法,就能生成高保真 UI 介面。

Claude Cowork Dispatch:AI 遠端協作新紀元,手機指令驅動桌機智慧工作流

Claude Cowork Dispatch:AI 遠端協作新紀元,手機指令驅動桌機智慧工作流

Anthropic 於 2026 年 3 月 18 日正式推出 Claude Cowork Dispatch,這項創新功能標誌著 AI 助手從單純的「對話工具」進化為能夠執行複雜任務的「遠端數位員工」。用戶現在只需透過手機發出指令,即可驅動在桌機上運行的 Claude AI 處理任務並回傳報表,無需時刻守在電腦前。這不僅是 Claude Cowork 生態系統的重大里程碑,更為知識工作者開啟了跨裝置、無縫協作的全新可能性。