【科技實測】2025 最新研究:AI 編程工具翻車?資深開發者用 Claude + Cursor 效率竟下滑 19%

AI 編程工具翻車實測!METR 發現資深開發者用 Claude + Cursor 反而效率下滑 19%,結果與預期大逆轉。

【科技實測】2025 最新研究:AI 編程工具翻車?資深開發者用 Claude + Cursor 效率竟下滑 19%

METR 在 2025 年 7 月 10 日發布了一份話題性十足的研究報告——Measuring the Impact of Early‑2025 AI on Experienced Open‑Source Developer Productivity》,這是目前最接近「真實使用情境」的 AI 工具實測之一,參與者全是 GitHub 星數爆表、程式碼貢獻數以百萬計的開源大神。

結果卻狠狠顛覆大家的期待。

使用 AI 開發時間反而變慢

核心發現

  • 對象:16 位資深開源開發者(平均貢獻 22k+ star、程式碼行數達數百萬行),各自挑選 246 個真實 issue,平均每人處理約 15 個任務,隨機分配為「可用 AI 協助」或「不可用」兩組。
  • 結果:使用 AI(以 Cursor Pro 搭配 Claude 3.5/3.7 為主)反而使完成時間 延長 19%,效果與開發者原先預期(縮短 24%)完全相悖。即使實際延長,開發者仍誤以為自己變快了 20%。

為何會變慢?

研究指出以下幾個主

1. 審查時間增加:AI 建議「大致正確」,但需額外修改與確認,反而拖慢節奏。

2. 高熟悉度反作用:參與者都非常熟悉手上的程式庫,真人勝過 AI 的即時生成。

3. 學習曲線:多位開發者首次使用 Cursor,缺乏足夠熟練度。唯一有超過 50 小時 Cursor 經驗者,反而獲得速度提昇

4. 心理錯覺:搭配 AI 做事更輕鬆,但並不代表更快,這種「感覺快」的認知偏差也被大規模自我報告所掩蓋

社群觀點摘錄

來自 Reddit、Hacker News 等開發者社群的直接摘錄如下:

“Developers thought they were 20% faster with AI tools, but they were actually 19% slower…” (Reddit)

「開發者原以為用 AI 工具會讓自己快 20%,結果實際上竟然慢了 19%……」

“A quarter of the participants saw increased performance, 3/4 saw reduced performance... positive speedup for the one developer who has more than 50 hours of Cursor experience.” (Hacker News)

「只有四分之一的參與者表現有提升,四分之三的效率反而下降……唯一提升效率的,是那位使用 Cursor 超過 50 小時的開發者。」

“The big attention grabbing statistics is that Developers expected AI to make them 20% faster and it actually made them 20% slower... the AI was not as proficient as a highly proficient human doing a complex task they are familiar with.” (Reddit)

「最吸睛的數據就是:開發者原本預期 AI 會讓他們變快 20%,結果實際上卻讓他們慢了 20%……AI 還是比不上熟練開發者處理自己熟悉任務的能力。」

對於 AI 開發工具的啟示

對資深/熟悉領域的開發者

目前的 AI 編碼工具對於高度熟悉的任務,短期內不僅沒有助速,反而拖慢進度這與 benchmark 測試的結果大相逕庭。

對新手或非熟悉領域者

先前研究指出:AI 在熟悉度低的任務或 junior 開發者中,仍有機會提升效率

心智預期與實際速度差距

開發者容易產生認知偏誤,誤以為工具提升效率,但實際效果相反,這提醒我們在衡量 AI 成效時必須有客觀數據佐證,而非依據主觀感受。

長期趨勢觀察

METR 表示將延續此研究模式,隨 AI 工具的快速進化,持續追蹤影響力。

結論建議

  1. 不論是企業還是開源專案,在 AI 工具導入初期應設計客觀的效果衡量機制,而非單靠印象或自評。
  2. 有素材的開發者:若已有 Cursor 類 AI 工具使用經驗,可能取得效率優勢。建議投入 >50 小時正式導入流程前先做內部熟練與實驗。
  3. 新手或跨領域場景:AI 工具可加速學習與定位問題,但也需要評估對複雜任務的支持程度。
  4. 工具開發者:需要優化 AI 建議的精準性,減少開發者額外審查與修正成本。

此份研究在目前是對 AI 編碼工具在真實且高度熟悉環境中的首次 RCT 實驗,提供相當關鍵的反思與方向。

如果你喜歡我們提供的資訊,記得訂閱下方AI郵報電子報,每周必知5件AI大事絕不錯過!!

Source

Read more

Google Flow突破一億影片大關:AI影片生成市場的深度解析與未來思辨

Google Flow突破一億影片大關:AI影片生成市場的深度解析與未來思辨

Google DeepMind執行長Demis Hassabis於8月19日在X平台宣布了一個震撼整個科技界的里程碑:Flow AI影片創作工具自5月發布以來,僅用三個月就突破了一億支影片的創作量。這個數字不僅代表著平均每日110萬支影片的驚人產量,更象徵著AI影片生成技術已從實驗室走向主流市場,正在重塑整個數位內容產業的格局。 從市場數據來看,全球AI影片生成器市場正呈現爆炸性增長。根據Fortune Business Insights的最新報告,市場規模預計將從2024年的6.15億美元增長至2032年的25.6億美元,年複合成長率高達20%。然而,當我們深入剖析這個現象時,會發現它揭示的不僅是技術突破,更是整個創作生態系統面臨的根本性變革。這種變革背後隱藏著什麼樣的機遇與挑戰?又將如何重新定義創意產業的未來? 爆發性增長背後的深層驅動力 技術整合帶來的質變 Flow能夠在短時間內達成如此驚人的成績,很大程度上源於其獨特的技術架構優勢。與市面上單一功能的AI工具不同,Flow整合了Google DeepMind最先進的三大模型:Veo 3影片生成引擎、Imagen 4圖像

Made by Google 2025:AI 時代下的智慧手機戰略重塑

Made by Google 2025:AI 時代下的智慧手機戰略重塑

Made by Google 2025 發表會不僅僅是一場產品發布,更是 Google 對未來智慧手機生態的戰略宣示。當蘋果在 AI 領域仍在追趕、三星持續依賴漸進式升級時,Google 正透過 Pixel 10 系列重新定義何為「智慧」手機。這場發表會背後隱藏的深層邏輯,正是科技巨頭們在 AI 原生時代的競爭新格局。 為什麼現在是 AI 手機的關鍵時刻? 市場時機的戰略考量 Google 選擇在蘋果九月發表會前搶先出手,絕非偶然。數據顯示,Google Pixel 在美國智慧手機市場僅占 3-4.5% 的份額,遠低於蘋果的 49% 和三星的 31%。然而,這個看似微不足道的市場佔有率,卻承載著 Google 更宏大的戰略企圖:透過硬體創新來展示 Android 生態系統的真正潛力。 Forrester