OpenAI 的 DALL-E 3 與 ChatGPT 結合,為 AI 視覺藝術開創新紀元!

OpenAI 最近宣布了其生成式 AI 視覺藝術平台 DALL-E 的第三版,現在允許用戶使用 ChatGPT 來創建提示,並包含更多的安全選項。DALL-E 可將文本提示轉換為圖像。但即使是 DALL-E 2 也經常出錯,忽略特定的措辭。OpenAI 的研究人員表示,最新版本更好地理解了上下文。

OpenAI 的 DALL-E 3 與 ChatGPT 結合,為 AI 視覺藝術開創新紀元!

OpenAI 最近宣布了其生成式 AI 視覺藝術平台 DALL-E 的第三版,現在允許用戶使用 ChatGPT 來創建提示,並包含更多的安全選項。DALL-E 可將文本提示轉換為圖像。但即使是 DALL-E 2 也經常出錯,忽略特定的措辭。OpenAI 的研究人員表示,最新版本更好地理解了上下文。

DALL-E 3 的一個新功能是與 ChatGPT 的整合。使用 ChatGPT,人們不必自己提出詳細的提示來指導 DALL-E 3;他們只需要求 ChatGPT 提供一個提示,聊天機器人將寫出一段段落(DALL-E 更適合使用較長的句子)供 DALL-E 3 遵循。其他用戶如果對 DALL-E 有特定的想法,仍然可以使用自己的提示。

在向 The Verge 的演示中,DALL-E 團隊的首席研究員和負責人 Aditya Ramesh 被提示使用 ChatGPT 幫助他為山中的拉麵餐廳設計一個標誌。ChatGPT 隨後寫了一個較長的提示,DALL-E 提供了四個選項。其中最受喜愛的是一個山的呈現,有拉麵雪帽,像瀑布一樣的湯流淌下,地上像花園石頭一樣的醃蛋,儘管它看起來更像是一些不錯的商品的插圖,而不是傳統的餐廳標誌。

DALL-E 3 將首先在 10 月發布給 ChatGPT Plus 和 ChatGPT Enterprise 用戶,隨後在秋季發布給研究實驗室和其 API 服務,OpenAI 計劃分階段發布 DALL-E 3,但尚未承諾何時將發布免費的公共版本。OpenAI 聲稱,它在 DALL-E 3 上投入了大量工作,創建了堅固的安全措施,以防止創建淫穢或可能帶有仇恨的圖像。

Read more

OpenAI 重磅發布:GPT-Realtime 引領語音 AI 新紀元,挑戰 Google 語音霸主地位

OpenAI 重磅發布:GPT-Realtime 引領語音 AI 新紀元,挑戰 Google 語音霸主地位

OpenAI 於 2025 年 8 月 28 日正式發布了革命性的「GPT-Realtime」模型以及全面升級的 Realtime API,這項發布標誌著語音 AI 技術從實驗階段邁向企業級生產應用的重要轉折點。新技術不僅在語音交互自然度上實現重大突破,更透過與電信龍頭 T-Mobile 的現場合作演示,展現了語音 AI 在實際商業場景中的巨大潛力。

【AI工具地圖】Nano-Banana 是什麼?Google 最新 AI 模型的 6 個顛覆性功能

【AI工具地圖】Nano-Banana 是什麼?Google 最新 AI 模型的 6 個顛覆性功能

想把插畫角色變成立體公仔?過去這需要專業 3D 建模與渲染,但 Google 最新的 Nano Banana AI 工具正改寫規則。只要一句自然語言指令,它就能自動完成影像編輯,甚至把 2D 角色生成逼真的 3D 公仔效果。這項技術不僅降低了創作門檻,也讓「人人都能做手辦」成為可能。雖然仍在實驗階段,但它已展現出顛覆影像編輯與設計流程的巨大潛力。

lock-1
Google「Nano Banana」正式發布:Gemini 2.5 Flash Image Preview的技術革命

Google「Nano Banana」正式發布:Gemini 2.5 Flash Image Preview的技術革命

Google DeepMind團隊今日正式揭曉了近期在社群媒體上引起瘋狂討論的神秘AI工具「Nano Banana」的真實身份——它就是Google最新發布的Gemini 2.5 Flash Image Preview。這款被Google官方稱為「state-of-the-art」的圖像生成和編輯模型,已經在LMArena排行榜上榮登全球第一的位置,並即日起在Gemini應用程式中向所有用戶免費開放。