ChatGPT 現已支援實時網頁瀏覽,DALL-E 3 進入公測階段

OpenAI 最近宣布了其生成式人工智慧服務的兩大進展,首先文字生成聊天機器人 ChatGPT 的網際網路搜尋服務全面上線,這是 Browse with Bing 功能從 beta 版轉變為正式功能,這項功能允許 ChatGPT 透過 Bing 查詢網際網路的即時資訊,包括運動賽事比分、股價或氣象等。此外,生成式人工智慧模型 DALL-E 3 也開始公測,允許用戶輸入文字生成圖片。

ChatGPT 現已支援實時網頁瀏覽,DALL-E 3 進入公測階段

OpenAI 最近宣布了其生成式人工智慧服務的兩大進展,首先文字生成聊天機器人 ChatGPT 的網際網路搜尋服務全面上線,這是 Browse with Bing 功能從 beta 版轉變為正式功能,這項功能允許 ChatGPT 透過 Bing 查詢網際網路的即時資訊,包括運動賽事比分、股價或氣象等。此外,生成式人工智慧模型 DALL-E 3 也開始公測,允許用戶輸入文字生成圖片。

Browse with Bing 功能在今年 6 月首次推出,專為付費版用戶提供。但由於該功能被發現可以用來繞過網路出版商的付費牆,因此在 7 月初被關閉。兩周前,該功能重新上線,現在已經成為 GPT-4 模型選擇器的標準選項,不再需要用戶從設定頁切換到 beta 版。

至於 DALL-E 3,該模型在 7 月以邀請制展開限定測試,當時吸引了 100 萬人參與。經過 3 個月的測試,現在 DALL-E 3 開放給所有人公測。該模型已整合到 ChatGPT 中,用戶可以輸入從簡單一句話到詳細的文字段落,由 ChatGPT 生成圖片。在桌機版或手機版上,用戶只需到 GPT-4 選擇器選擇 DALL-E 3 即可啟用這項功能。

OpenAI 上個月表示,DALL-E 3 在理解用戶意圖方面「顯著優於」前一版本,尤其是對於長而詳細的提示。該公司表示,這個工具在渲染圖像方面做得更好,包括手部(這是許多人工智慧圖像生成器都有困難的部分)。此外,該工具允許用戶用自然語言輸入跟進查詢來調整結果。不像前一版本,該公司表示 DALL-E 3 拒絕模仿在世藝術家的風格,這有助於避免潛在的訴訟。

Read more

OpenAI 重磅發布:GPT-Realtime 引領語音 AI 新紀元,挑戰 Google 語音霸主地位

OpenAI 重磅發布:GPT-Realtime 引領語音 AI 新紀元,挑戰 Google 語音霸主地位

OpenAI 於 2025 年 8 月 28 日正式發布了革命性的「GPT-Realtime」模型以及全面升級的 Realtime API,這項發布標誌著語音 AI 技術從實驗階段邁向企業級生產應用的重要轉折點。新技術不僅在語音交互自然度上實現重大突破,更透過與電信龍頭 T-Mobile 的現場合作演示,展現了語音 AI 在實際商業場景中的巨大潛力。

【AI工具地圖】Nano-Banana 是什麼?Google 最新 AI 模型的 6 個顛覆性功能

【AI工具地圖】Nano-Banana 是什麼?Google 最新 AI 模型的 6 個顛覆性功能

想把插畫角色變成立體公仔?過去這需要專業 3D 建模與渲染,但 Google 最新的 Nano Banana AI 工具正改寫規則。只要一句自然語言指令,它就能自動完成影像編輯,甚至把 2D 角色生成逼真的 3D 公仔效果。這項技術不僅降低了創作門檻,也讓「人人都能做手辦」成為可能。雖然仍在實驗階段,但它已展現出顛覆影像編輯與設計流程的巨大潛力。

lock-1
Google「Nano Banana」正式發布:Gemini 2.5 Flash Image Preview的技術革命

Google「Nano Banana」正式發布:Gemini 2.5 Flash Image Preview的技術革命

Google DeepMind團隊今日正式揭曉了近期在社群媒體上引起瘋狂討論的神秘AI工具「Nano Banana」的真實身份——它就是Google最新發布的Gemini 2.5 Flash Image Preview。這款被Google官方稱為「state-of-the-art」的圖像生成和編輯模型,已經在LMArena排行榜上榮登全球第一的位置,並即日起在Gemini應用程式中向所有用戶免費開放。