微软下架争议博文:教用户用盗版《哈利 · 波特》全集训练 AI

微软下架争议博文:教用户用盗版《哈利 · 波特》全集训练 AI
2026年02月21日 10:00 IT之家

IT之家 2 月 21 日消息,科技媒体 Ars Technica 昨日(2 月 20 日)发布博文,报道称微软遭到舆论强烈反弹后,删除了 Azure 官方博客上一篇发布于 2024 年 11 月的技术教程。

IT之家援引博文介绍,该文章由微软高级产品经理 Pooja Kamath 撰写,主要演示如何利用 Azure SQL 数据库和 LangChain 技术快速构建生成式 AI 应用。

不过文章的核心演示案例竟是指导用户下载并使用盗版的《哈利 · 波特》全集来训练大语言模型(LLM)。

为了展示新功能的“亲和力”,该教程设计了两个应用场景:构建问答系统和生成同人小说。作者展示了一个由 AI 生成的营销故事:

教程还附带了一张哈利与朋友带有微软 Logo 的生成图片。法律专家 Cathay Y. N. Smith 指出,这种利用受版权保护的角色进行商业营销的行为,极易触犯版权法。

教程中提供的训练数据链接指向数据科学平台 Kaggle 上的一个数据集。该数据集包含《哈利 · 波特》全七册电子书,且被上传者 Shubham Maindola 错误地标记为“公有领域(Public Domain)”。

尽管该数据集已存在多年并积累了超过一万次下载,但《哈利 · 波特》系列显然仍处于版权保护期内。在媒体 Ars Technica 联系上传者后,Maindola 承认标记错误并删除了数据集,称其本无意误导版权状态。

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片