全球首位AI工程師問世「Devin」,自動化完成複雜工程任務

AI軟體工程師的突破「Devin」,自動化完成複雜工程任務

AI新創公司Cognition最近推出了名為「Devin」的AI軟體工程師,這是一個創新的自動化工具,目前僅對少數客戶開放,Devin不僅能夠自主完成軟體工程的各個階段,還能夠自行處理從程式碼編寫到bug修復的整個流程。

Devin的突出之處在於其能力遠超過傳統的AI程式碼工具,如Github Copilot,它能夠獨立處理軟體工程項目的多個步驟,始終保持任務導向。Devin能夠在沙盒運算環境中使用常見的開發工具,如Shell、程式碼編輯器和瀏覽器,並能夠計劃和實施需要數千個決策的複雜工程任務。

使用者只需通過Devin的聊天機器人界面輸入自然語言指令,AI就會開始制定詳細的逐步計劃來解決問題。Devin將使用開發工具來編寫程式碼、修復bug、進行測試和報告進度,而使用者可以實時監控Devin的執行狀況。如果出現問題,使用者可以隨時返回聊天界面,指示AI進行修復。

在性能測試中,Devin獨立解決了13.86%的案例,無需人工干預,這一成績顯著高於其他AI模型,例如Claude 2解決了4.8%的問題,而SWE-Llama-13b和GPT-4的解決率分別為3.97%和1.74%,且這些模型都需要人類的協助。

Cognition的創辦人Scott Wu領導的團隊,由世界級的程式設計競賽選手組成,公司在A輪融資中募集了2100萬美元。Cognition的目標是通過Devin協助工程團隊將某些專案委託給AI,從而專注於需要人類創造力的任務,Devin的出現不僅展示了軟體開發的新可能性,也預示著未來開發工作可能在人類監督下由AI全面完成。

Leave a Reply

Your email address will not be published. Required fields are marked *