IT之家2月21日消息,科技媒體 Ars Technica 昨日(2月20日)發布博文,報道稱微軟遭到輿論強烈反彈后,刪除了 Azure 官方博客上一篇發布于2024年11月的技術教程。
IT之家援引博文介紹,該文章由微軟高級產品經理 Pooja Kamath 撰寫,主要演示如何利用 Azure SQL 數據庫和 LangChain 技術快速構建生成式 AI 應用。
不過文章的核心演示案例竟是指導用戶下載并使用盜版的《哈利 · 波特》全集來訓練大語言模型(LLM)。
![]()
微軟下架爭議博文 圖源:已刪除的微軟博客
為了展示新功能的“親和力”,該教程設計了兩個應用場景:構建問答系統和生成同人小說。作者展示了一個由 AI 生成的營銷故事:
在霍格沃茨特快列車上,哈利 · 波特遇到了一位新朋友,這位朋友向哈利熱情推銷微軟 SQL 中的“原生向量支持”(Native Vector Support)功能,并將其比作“麻瓜世界的魔法”。
教程還附帶了一張哈利與朋友帶有微軟 Logo 的生成圖片。法律專家 Cathay Y. N. Smith 指出,這種利用受版權保護的角色進行商業營銷的行為,極易觸犯版權法。
教程中提供的訓練數據鏈接指向數據科學平臺 Kaggle 上的一個數據集。該數據集包含《哈利 · 波特》全七冊電子書,且被上傳者 Shubham Maindola 錯誤地標記為“公有領域(Public Domain)”。
盡管該數據集已存在多年并積累了超過一萬次下載,但《哈利 · 波特》系列顯然仍處于版權保護期內。在媒體 Ars Technica 聯系上傳者后,Maindola 承認標記錯誤并刪除了數據集,稱其本無意誤導版權狀態。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.