道德議題

為什麼白宮希望駭客欺騙人工智能？

在本週的世界最大的年度駭客大會——Def Con 31將在拉斯維加斯舉行，焦點集中在大型語言模型上，像是OpenAI的ChatGPT和Google的Bard等聊天機器人。白宮對於這個活動特別有興趣，他們希望了解為什麼有如此多的駭客聚集在一起，試圖欺騙和尋找人工智能模型中的缺陷。

Hannah

06 Aug 2023 — 4 min read

大型科技公司，如Meta、Google、OpenAI、Anthropic、Cohere、Microsoft、Nvidia和Stability等，首次開放了他們強大的系統進行測試。這些公司希望透過這項競賽來確定他們人工智能系統中的問題，並創建獨立評估機制。活動的組織者之一、哈佛大學的人工智能研究員拉曼·楚德里博士表示，這將是一個安全的空間，供公司討論問題並解決它們。

如何運作?

競賽中的參賽者將在兩天半的時間內，使用158台筆記型電腦，每人有50分鐘的時間來嘗試在八個大型語言人工智能模型中尋找缺陷。參賽者將不知道他們正在使用哪家公司的模型，成功完成挑戰會獲得積分，獲得最高總分的人將獲勝。

挑戰中的一個重要部分是要駭客讓模型產生關於政治人物或重要人物的虛構事實，這將有助於測試模型的一致性和可能存在的偏見。Cohere的AI安全主管塞拉菲娜·戈爾德法布-塔朗特博士表示，雖然人們知道模型可以編造事實，但不清楚它發生的頻率。

她說：“我們知道模型會有幻覺信息，但提高人們對其發生頻率的認識將是有用的，而目前我們還不清楚這個頻率。"

戈爾德法布-塔朗特博士表示模型的一致性也將受到測試，人們對人工智能在不同語言中的工作方式有所擔憂。她說：“安全防護在不同語言中並不起作用，而人們則認為它們會起作用。” 例如，如果您在英語中問各種大型語言模型如何加入恐怖組織，它們不會給您答案，因為有一個安全機制。然而，若使用不同的語言問模型，它則會給出要遵循的步驟清單。

戈爾德法布-塔朗特博士一直在為Cohere的模型做準備，並表示儘管這些模型很強大，但“這並不意味著它們沒有漏洞，只是我們還沒有找到它們”。

當前人工智能問題

白宮支持這個活動，他們希望這個競賽能為研究人員和公眾提供有關這些模型影響的關鍵信息，並促使人工智能公司和開發者解決這些模型中可能存在的問題。

這些公司開發工具的速度引發了人們對虛假信息傳播的擔憂，尤其是在明年美國總統大選之前。 7 月份，七家領先的人工智能公司承諾採取自願保障措施來管理該技術帶來的風險，但法律保障措施需要更長的時間才能達成一致。楚德里博士表示，這不是在問人工智能是否能引發核武器，而是挑戰這些系統是否嵌入了危害和偏見。

“比如他們是否對我們撒謊，編造虛假的首都，謊報他們是否是合格的醫務人員，或是編造一條完全虛假的政治信息？”

楚德里博士表示，政府現在就需要花時間監管人工智能，以防止假消息的擴散。人工智能的持續發展將取決於解決當前問題的能力，以創建沒有偏見和歧視的人工智能模型。目前的活動結果將在明年二月公布，並將成為人工智能發展的重要參考依據。

(原文出自:https://www.bbc.com/news/technology-66404069)

OpenAI 史上最大募資 1,220 億美元！「下一階段 AI」，不再只是模型多強

OpenAI 完成 1220 億美元的募資，估值高達 8.520 億美元。這是 AI 史上規模最龐大的一次融資，由 Amazon、NVIDIA、SoftBank 領投，Microsoft 繼續參與。

Anthropic 一週兩次資安失誤：Claude Code 50 萬行原始碼意外裸奔，44 個隱藏功能全曝光

2026 年 3 月 31 日，Anthropic 在 npm 發布 Claude Code 2.1.88 時意外附上完整 source map，導致 512,000 行 TypeScript 原始碼公開在網路上，揭露包括永遠在線代理 KAIROS、多代理協調模式、Undercover Mode 等 44 個未公開功能，並伴隨 axios 供應鏈攻擊同日爆發。

為什麼你的 CV 明明不差，卻還是對不上理想 program？我用這套 keyword 分析法找答案

選校不是只看排名，而是看 fit 這句話很多人都聽過。但真正知道怎麼做到的人，其實不多。大部分人的做法是：先把 CV 整理好，去官網看一下 program 介紹，感覺不錯就投。這樣做最大的問題是：你是用自己的框架去看 program，而不是用 program 的框架來看自己。只要這個順序錯了，不管你把 CV 改得多流暢，方向都還是可能不對。我自己曾經繞過的彎路申請前期，我花了很多時間優化 CV。我把每一條 bullet point 改得更精準，數字更清楚，動詞更有力。改完之後，自己也覺得好像不錯。但投了幾間之後，我一直有一種說不上來的感覺：好像哪裡不太對。後來我把其中一間學校的 program handbook 仔細讀了一遍，才發現這個 program 真正在意的能力方向，和我 CV 裡強調的重點其實有明顯錯位。

Mistral AI 砸 8.3 億！建造巴黎資料中心，強化歐洲 AI 主權

Mistral AI 透過債務融資募集 8.3 億美元，用於在巴黎附近興建大型AI資料中心。部署 NVIDIA最新 GPU，加速其大型語言模型的訓練與推論，從「模型開發」走向「基礎設施自建」。