来自中国的DeepSeek AI模型的出现引发了美国科技行业的激烈辩论和关注,尤其是在唐纳德·特朗普(Donald Trump)将其标记为“唤醒电话”之后。 DeepSeek的R1型号的引入被吹捧为像Chatgpt这样的Western AI产品的一种更便宜的替代品,导致NVIDIA的市场价值下降了6000亿美元。 NVIDIA是GPU市场中对AI模型运营至关重要的主要力量,其份额下降了16.86%,这是华尔街历史上最大的单日损失。 Microsoft,Meta Platforms和Google的母公司Alphabet等其他科技巨头的经历从2.1%下降到4.2%,而AI服务器制造商Dell Technologies下降了8.7%。
DeepSeek的R1型号建立在开源DeepSeek-V3上,据报道需要更少的计算能力,并以成本的一小部分接受培训,估计仅为600万美元。这引发了有关美国公司在AI的大规模投资的疑问,这引起了投资者的烦恼。 DeepSeek的模型很快成为美国下载最多的免费应用程序,这是关于其成本效益和能力的讨论。
在这些事态发展中,彭博社报道说,Openai和Microsoft正在研究DeepSeek是否使用OpenAi的API将OpenAI的AI模型集成到了自己的AI模型中,这是一种称为蒸馏的做法。该技术涉及从较大模型中提取数据来培训较小的模型,这违反了Openai的服务条款。 Openai强调了其致力于保护其知识产权,并与美国政府合作,以保护AID AI模型免受对抗性的使用。
特朗普总统的AI沙皇戴维·萨克斯(David Sacks)在福克斯新闻上强调了这个问题,这表明美国AI公司将采取措施在未来几个月内采取这种蒸馏。具有讽刺意味的是,观察者并没有丢失这种情况,技术公关和作家Ed Zitron指出了Openai自己使用受版权保护的Internet内容来培训Chatgpt的历史。
2024年1月,Openai承认有必要使用受版权保护的材料来训练Chatgpt等大型语言模型。在向英国上议院通讯和数字选择委员会提交的提交中,Openai认为,排除受版权保护的材料将严重限制现代AI系统的能力。这种立场激发了关于对版权内容的培训AI的道德和合法性的持续辩论,这些诉讼涉及诸如纽约时报对OpenAI和Microsoft于2023年12月“非法使用”其内容的诉讼。 Openai通过捍卫这种做法为“合理使用”,并主张诉讼的无用性。
争议超出了新闻机构,其中包括2023年9月提起的17位作者的诉讼,其中包括乔治·RR·马丁(George RR Martin),指控“大规模盗窃有系统的盗窃”。此外,美国法官贝里尔·豪威尔(Beryl Howell)在上一年的8月份维持裁决的美国版权局说,AI基础的艺术不能受到版权保护,这强调了人类创造力在版权法中的重要性。
DeepSeek被指控使用Openai的模型使用蒸馏来训练其竞争对手。图片来源:Andrey Rudakov/Bloomberg通过盖蒂图像。