![]()
做產品的都知道,數據是AI的燃料。但燃料從哪來,往往沒人細究——直到有人翻賬單。
三個YouTube頻道最近把蘋果告了。Ted Entertainment、Matt Fisher和Golfholics指控蘋果繞過平臺的反爬蟲機制,下載了數百萬條視頻訓練AI模型。原告稱自己的內容在數據集中出現了超過500次,要求代表所有權利相似的創作者發起集體訴訟。
事情源于蘋果研究團隊去年發表的一篇論文。團隊使用了名為Panda-70M的數據集,訓練一個視頻生成模型。這個數據集像一份帶坐標的地圖:它不直接存視頻,而是用網址、ID和時間戳標記YouTube上的具體片段。想提取任何一個片段,都得重新訪問原視頻并截取——每截一次,就是一次獨立的"規避"行為。
原告的邏輯很直接:你用了鏈接導航,但最終還是下載了原內容,這就等于繞過了YouTube的保護措施。
訴訟請求列了六項,從集體訴訟認定到法定賠償、禁令救濟,措辭嚴謹得像產品需求文檔。除了蘋果,亞馬遜和OpenAI也被同一批原告盯上,三家公司都被指使用了同一個數據集。
有意思的是,這場訴訟暴露了一個行業潛規則:AI公司訓練模型時,數據集的"干凈程度"往往取決于鏈接跳轉了幾層。就像用戶以為自己在用"隱私模式",實際上cookie早被記下了。
一位原告在起訴后更新了頻道動態,沒有提官司,只寫了一句:"今天開始給所有視頻加水印。"
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.