OpenAI與Google被指控使用YouTube影片轉錄訓練AI,可能觸犯版權

OpenAI與Google被指控使用YouTube影片轉錄訓練AI,可能觸犯版權

根據《紐約時報》的報導,OpenAI和Google被指採用從YouTube影片轉錄的文字來訓練他們的人工智慧模型,這一做法可能侵犯了創作者的版權。報導援引多位了解這些公司做法的人士的話說,為了最大化餵養給AI的數據量,OpenAI、Google及Meta已經走到了極端。這一報導發布的時間點,正值YouTube CEO Neal Mohan在接受彭博原創訪談時表示,OpenAI使用YouTube影片來訓練其新的文字到影片生成器Sora,將違反平台政策之後不久。

據《紐約時報》稱,OpenAI使用其Whisper語音識別工具轉錄了超過一百萬小時的YouTube影片,這些轉錄後的文字隨後被用來訓練GPT-4。《信息》之前報導稱,OpenAI曾使用YouTube影片和播客來訓練這兩個AI系統。OpenAI總裁Greg Brockman據報是這個團隊的成員之一。根據Google的規則,未經授權抓取或下載YouTube內容是不被允許的,Google的發言人Matt Bryant對《紐約時報》表示,該公司不知道OpenAI有這樣的使用。

然而報導聲稱,Google內部有人知道但沒有對OpenAI採取行動,因為Google也在使用YouTube影片來訓練自己的AI模型。Google告訴《紐約時報》,它只是用那些同意此事的創作者的影片來這麼做。Engadget已經聯繫Google和OpenAI尋求評論。

報導還稱,Google在2023年6月要求一個團隊調整其隱私政策,以更廣泛地涵蓋其使用公開可用內容(包括Google Docs和Google Sheets)來訓練其AI模型和產品的做法。這些變更出於澄清的目的,在7月被發布。Bryant告訴《紐約時報》,這類數據只是在用戶選擇參加Google的實驗功能測試時使用,該公司「並未基於這種語言變更開始訓練額外類型的數據」,這次變更增加了Bard作為可能使用該數據的例子。

Leave a Reply

Your email address will not be published. Required fields are marked *