Midjourney 推出瀏覽器圖像生成,並籌劃重大更新

Midjourney近日啟動了其全新的網站,並計劃在瀏覽器中進行基於瀏覽器的圖像生成。Midjourney 主要是通過 Discord 運營,但現在該公司希望將其完整服務帶到瀏覽器中,新網站的首版主要專注於在用戶生成和社區生成的圖像中進行更好的圖像和提示搜索,更好的圖像瀏覽,以及透過提示更快查看圖像,未來版本將提供更多的組織功能,如收藏功能將計劃在即將到來的版本中推出。

Midjourney 推出瀏覽器圖像生成,並籌劃重大更新

Midjourney近日啟動了其全新的網站,並計劃在瀏覽器中進行基於瀏覽器的圖像生成。Midjourney 主要是通過 Discord 運營,但現在該公司希望將其完整服務帶到瀏覽器中,新網站的首版主要專注於在用戶生成和社區生成的圖像中進行更好的圖像和提示搜索,更好的圖像瀏覽,以及透過提示更快查看圖像,未來版本將提供更多的組織功能,如收藏功能將計劃在即將到來的版本中推出。

新的 Midjourney 網站設計時尚、速度快,你可以找到來自社區的靈感和提示,最重要的新功能是直接在瀏覽器中生成圖像,而不是通過 Discord。目前尚不清楚瀏覽器中的圖像生成何時開始,但應該不會太久:該功能已在界面中可見,只是尚未啟動(即將推出)。

Midjourney 在 Discord 上運行得非常成功,但聊天軟件的複雜性可能會使潛在用戶望而卻步。相信未來透果瀏覽器提供服務,會是用戶大幅增長的關鍵。與此同時,OpenAI 最近也展示了 DALL-E 3,OpenAI 的新圖像 AI 在純圖像質量方面並不一定領先,最好的情況是與 Midjourney 相當,但稍微在真實感方面落後。但DALL-E 3更精確地遵循了提示,並且通過 ChatGPT 使用它,只需與它交談而不是提示。

Midjourney 宣布在第六版也將提供質量的重大進步,並比目前的版本更好地遵循文本輸入,預計在今年底前會發布,我們一起期待!

Read more

OpenAI 重磅發布:GPT-Realtime 引領語音 AI 新紀元,挑戰 Google 語音霸主地位

OpenAI 重磅發布:GPT-Realtime 引領語音 AI 新紀元,挑戰 Google 語音霸主地位

OpenAI 於 2025 年 8 月 28 日正式發布了革命性的「GPT-Realtime」模型以及全面升級的 Realtime API,這項發布標誌著語音 AI 技術從實驗階段邁向企業級生產應用的重要轉折點。新技術不僅在語音交互自然度上實現重大突破,更透過與電信龍頭 T-Mobile 的現場合作演示,展現了語音 AI 在實際商業場景中的巨大潛力。

【AI工具地圖】Nano-Banana 是什麼?Google 最新 AI 模型的 6 個顛覆性功能

【AI工具地圖】Nano-Banana 是什麼?Google 最新 AI 模型的 6 個顛覆性功能

想把插畫角色變成立體公仔?過去這需要專業 3D 建模與渲染,但 Google 最新的 Nano Banana AI 工具正改寫規則。只要一句自然語言指令,它就能自動完成影像編輯,甚至把 2D 角色生成逼真的 3D 公仔效果。這項技術不僅降低了創作門檻,也讓「人人都能做手辦」成為可能。雖然仍在實驗階段,但它已展現出顛覆影像編輯與設計流程的巨大潛力。

lock-1
Google「Nano Banana」正式發布:Gemini 2.5 Flash Image Preview的技術革命

Google「Nano Banana」正式發布:Gemini 2.5 Flash Image Preview的技術革命

Google DeepMind團隊今日正式揭曉了近期在社群媒體上引起瘋狂討論的神秘AI工具「Nano Banana」的真實身份——它就是Google最新發布的Gemini 2.5 Flash Image Preview。這款被Google官方稱為「state-of-the-art」的圖像生成和編輯模型,已經在LMArena排行榜上榮登全球第一的位置,並即日起在Gemini應用程式中向所有用戶免費開放。