DeepSeek AI的低成本模型涉嫌使用OpenAI数据，在线引起讽刺

来自中国的DeepSeek AI模型的出现引发了美国科技行业的激烈辩论和关注，尤其是在唐纳德·特朗普（Donald Trump）将其标记为“唤醒电话”之后。 DeepSeek的R1型号的引入被吹捧为像Chatgpt这样的Western AI产品的一种更便宜的替代品，导致NVIDIA的市场价值下降了6000亿美元。 NVIDIA是GPU市场中对AI模型运营至关重要的主要力量，其份额下降了16.86％，这是华尔街历史上最大的单日损失。 Microsoft，Meta Platforms和Google的母公司Alphabet等其他科技巨头的经历从2.1％下降到4.2％，而AI服务器制造商Dell Technologies下降了8.7％。

DeepSeek的R1型号建立在开源DeepSeek-V3上，据报道需要更少的计算能力，并以成本的一小部分接受培训，估计仅为600万美元。这引发了有关美国公司在AI的大规模投资的疑问，这引起了投资者的烦恼。 DeepSeek的模型很快成为美国下载最多的免费应用程序，这是关于其成本效益和能力的讨论。

在这些事态发展中，彭博社报道说，Openai和Microsoft正在研究DeepSeek是否使用OpenAi的API将OpenAI的AI模型集成到了自己的AI模型中，这是一种称为蒸馏的做法。该技术涉及从较大模型中提取数据来培训较小的模型，这违反了Openai的服务条款。 Openai强调了其致力于保护其知识产权，并与美国政府合作，以保护AID AI模型免受对抗性的使用。

特朗普总统的AI沙皇戴维·萨克斯（David Sacks）在福克斯新闻上强调了这个问题，这表明美国AI公司将采取措施在未来几个月内采取这种蒸馏。具有讽刺意味的是，观察者并没有丢失这种情况，技术公关和作家Ed Zitron指出了Openai自己使用受版权保护的Internet内容来培训Chatgpt的历史。

2024年1月，Openai承认有必要使用受版权保护的材料来训练Chatgpt等大型语言模型。在向英国上议院通讯和数字选择委员会提交的提交中，Openai认为，排除受版权保护的材料将严重限制现代AI系统的能力。这种立场激发了关于对版权内容的培训AI的道德和合法性的持续辩论，这些诉讼涉及诸如纽约时报对OpenAI和Microsoft于2023年12月“非法使用”其内容的诉讼。 Openai通过捍卫这种做法为“合理使用”，并主张诉讼的无用性。

争议超出了新闻机构，其中包括2023年9月提起的17位作者的诉讼，其中包括乔治·RR·马丁（George RR Martin），指控“大规模盗窃有系统的盗窃”。此外，美国法官贝里尔·豪威尔（Beryl Howell）在上一年的8月份维持裁决的美国版权局说，AI基础的艺术不能受到版权保护，这强调了人类创造力在版权法中的重要性。

DeepSeek被指控使用Openai的模型使用蒸馏来训练其竞争对手。图片来源：Andrey Rudakov/Bloomberg通过盖蒂图像。