耐能智慧 AI晶片KL730即將問世,將大幅降低AI運營公司成本

在生成人工智能的世界中,計算能力和獲取最先進、最強大的芯片已成為一場戰鬥。邊緣AI科技公司耐能智慧(Kneron)日前宣布,將在今年年底前推出全新的神經處理單元(NPU)芯片,名為KL730,為運行大型語言模型(LLM)的成本大幅降低。

耐能智慧 AI晶片KL730即將問世,將大幅降低AI運營公司成本

在生成人工智能的世界中,計算能力和獲取最先進、最強大的晶片已成為一場戰鬥。邊緣AI科技公司耐能智慧(Kneron)日前宣布,將在今年年底前推出全新的神經處理單元(NPU)晶片,名為KL730,將大幅降低運算大型語言模型(LLM)的成本。

Kneron指出,KL730 NPU芯片的問世將大大降低運行大型語言模型的成本,這款處理器是專為機器學習和人工智能應用而設計。過去,成本一直是運行龐大AI模型的一大挑戰,KL730的推出有望在這一領域帶來一個嶄新的發展。

KL730是Kneron的下一代處理器,該公司在2021年推出了支持Transformer模型的KL530晶片,該模型支撐著一些生成式AI模型。Kneron的首席執行官Albert 劉向The Verge透露,NPU晶片專門為AI而設計,這消除了最初為處理圖像而設計的晶片被迫為AI工作的問題。他暗指了對人工智能晶片巨頭Nvidia的間接批評。他表示:“我想說的是,如果你擁有像我們這樣功能強大且輕量級的晶片,那麼你就可以將像GPT這樣強大的Transformer模型帶到多種設備中。”

耐能智慧 KL730邊緣AI晶片 (image:耐能智慧)

劉雖然沒有透露KL730的具體價格,但他指出與GPU晶片相比,他們的KL530晶片使用戶運營成本下降了75%。這項數據彰顯了新一代AI專用晶片的優勢。

多數AI公司和雲提供商都傾向於使用Nvidia的H100 Tensor Core GPU晶片,因為這被認為是最易於使用的處理器之一,能夠提供運行生成人工智能模型所需的計算能力。然而即使有這種能力,運行大型語言模型通常需要多個H100晶片,並需要進行模型“分解”以使其運行。

儘管如此,隨著對AI晶片的需求不斷增長,H100的價格飆升至每片約40,000美元左右。Nvidia已經宣布計劃在2024年第二季度推出更強大的AI芯片,同時競爭對手也在積極蠢蠢欲動,AMD計劃在今年第四季度推出自家的AI芯片。

Kneron表示,與之前的晶片相比,KL730的能效有了“三到四倍的飛躍”,並且具有每秒0.35兆次運算的基礎計算能力。新晶片還使得用戶能夠完全離線運行模型,無需連接到雲服務供應商,同時更安全地處理數據。

Kneron的KL730晶片在AI硬體領域引發了新的潮流,通過專為AI而設計的晶片,讓成本降低、效能提升,並且開創了更加安全、更具效率的AI應用可能性。在這個愈發重要的領域,Kneron的努力和創新必將為AI技術的未來描繪出更燦爛的前景。

Read more

OpenAI 不演了!收購 Mac AI 專屬工具 Sky,從 ChatGPT 到桌面,工作模式即將大變天

OpenAI 不演了!收購 Mac AI 專屬工具 Sky,從 ChatGPT 到桌面,工作模式即將大變天

OpenAI 又放大招!公司宣布收購 Apple 前員工創辦的 Software Applications Incorporated,其新創的旗艦產品 Sky 是 Mac 上的自然語言 AI 介面,能「看懂」螢幕並直接操作應用。這支 12 人小團隊將加入 OpenAI,把 Sky 的 macOS 魔法融入 ChatGPT,讓 AI 從聊天工具升級為你的桌面助手。 Sky:Mac 桌面上的隱形助手 Sky 不是單純的聊天工具,而是專為 Mac 打造的自然語言介面。它能看懂你螢幕上的內容並直接行動,寫報告時幫你拉資料、規劃行程時自動填入日曆、編碼時即時除錯。 想像一下:你邊寫報告邊問「幫我找最新市場數據」,Sky 直接在 Excel 開檔、

用 TapNow AI 打造你的第一支Kpop MV:從角色生成到剪輯上手的完整教學

用 TapNow AI 打造你的第一支Kpop MV:從角色生成到剪輯上手的完整教學

AI 正在重寫 MV 製作的遊戲規則。 在 TapNow AI 裡,你可以像導演一樣,指揮模型完成角色造型、鏡頭切換與節拍同步——不用攝影棚、不用後期團隊,卻能在幾分鐘內生成宛如韓星出道曲般的影片。 這份指南將帶你從零開始:學會建立偶像角色、運用金屬化與非金屬質感打造畫面層次、安排鏡頭節奏,最後剪出一支真正「能上線的」AI MV。 讓我們一起走進 TapNow 的工作流,親手拍出屬於你的第一支韓風 MV。

lock-1
【PwC Insight Hub】為什麼庫存壓力總是失控?這家製造商用 AI 做到 40% 減量的背後邏輯

【PwC Insight Hub】為什麼庫存壓力總是失控?這家製造商用 AI 做到 40% 減量的背後邏輯

日劇《下町ロケット》(下町火箭)講的是一間小工廠靠自研技術打進大企業供應鏈的故事,熱血背後,其實藏著最真實的製造業痛點——當每個部門都想「多備一點」以防萬一,庫存卻越堆越高。 PwC Consulting 協助一家高精密製造企業導入 AI × IBP 庫存優化計畫,重構權限模型與預測機制,在幾季內削減 40% 可控庫存。這篇案例揭示:減庫存的關鍵,不是砍料,而是讓整個組織都能「看得清風險、算得出彈性」。