报道据,leutherAI 的非盈余机闭下载这些字幕文献的是一个名为 E,开辟者操练 AI 模子他们声称其目标是帮帮科技巨头被曝未经授权用YouTu。是为幼型开辟者和学术探讨者供应操练质料固然 EleutherAI 的初志可以,果等科技巨头运用但该数据集也被苹。
件显示有文,的 OpenELM 模子几周之前苹果正在 4 月份公布了备受闭怀,Pile”实行操练就运用了“The 。hone 和 Macbook 中列入新的 AI 效力而 OpenELM 模子的公布恰逢苹果公布将正在 iP。
者披露视察记,上万个 YouTube 视频的素材来操练 AI少许寰宇上最宽裕的科技公司继续正在愚弄来自成千,止从平台上未经许可抓取实质的规则而这违反了 YouTube 禁。悉据,ouTube 视频字幕文献被用来操练人为智能模子越过 17.3 万个来自 4.8 万个频道的 Y,lesforce 等硅谷巨头个中就蕴涵苹果、英伟达、Sa。
家贯注到IT之,Beast、PewDiePie、以及脱口秀主理人斯蒂芬・科尔伯特、约翰・奥利弗和吉米・坎摩尔等此次变乱影响到的创作家蕴涵著名科技博主 MKBHD (Marques Brownlee)、Mr。文献相当于视频的文本转录实质这些被用于操练 AI 的字幕be内容训练AI苹果、英伟达在列。
AI 公布的一篇探讨论文遵循 Eleuther,e Pile”的大型数据集的一局限这份数据集是他们公布的名为“Th。的大局限数据集都是公然的“The Pile”中,盘算才干的人都能够访谒任何具有足够存储空间和。巨头以表除了科技,也运用了该数据集少许学者和开辟者。而然太平洋在线xg111也正在他们的探讨论文和帖子中提到了他们怎么运用该数据集来操练 AI 模子苹果、英伟达和 Salesforce 等市值数百亿以至数千亿美元的公司。
意的是须要注,有下载这些数据苹果本人并没,herAI 落成的而是由 Eleut。此因,层面来说从技巧,了 YouTube 的运用条目是 EleutherAI 违反。
YouTube 视频创作家准许蕴涵苹果正在内的少许科技巨头未经,文献来操练人为智能模子就运用了他们视频的字幕。
能运用了公然的数据集尽量苹果和其他公司可,操练 AI 编造所带来的公法危急但此变乱凸显了从汇集上抓取数据来。答幼多话题时模仿整段文本的案例此前就曾涌现过 AI 编造正在回,方编译的数据集时当公司运用第三,可运用素材的危急只会增多未经许。

推荐文章