O surgimento de modelos Deepseek IA da China provocou intenso debate e preocupação no setor de tecnologia dos EUA, principalmente depois que Donald Trump o rotulou como "despertar". A introdução do modelo R1 da Deepseek, apresentado como uma alternativa significativamente mais barata às ofertas ocidentais de IA como o ChatGPT, levou a uma dramática queda de US $ 600 bilhões no valor de mercado da NVIDIA. A Nvidia, uma força dominante no mercado de GPU crítica para as operações do modelo de IA, viu suas ações despencarem em 16,86%-a maior perda de um dia na história de Wall Street. Outros gigantes da tecnologia, como Microsoft, Meta Plataform, e a empresa controladora do Google, Alphabet, sofreram declínios que variam de 2,1%a 4,2%, enquanto a Dell Technologies, fabricante do servidor de AI, caiu 8,7%.
O modelo R1 da Deepseek, construído no Deepseek-V3 de código aberto, requer menos poder de computação e foi treinado por uma fração do custo, estimado em apenas US $ 6 milhões. Isso levantou questões sobre os enormes investimentos americanos que as empresas estão fazendo na IA, causando nervosismo aos investidores. O modelo de Deepseek rapidamente se tornou o aplicativo gratuito mais baixado nos EUA, alimentado por discussões sobre sua relação custo-benefício e capacidades.
Em meio a esses desenvolvimentos, a Bloomberg relatou que o Openai e a Microsoft estão investigando se o DeepSeek usou a API do OpenAI para integrar os modelos de IA do OpenAI, uma prática conhecida como destilação. Essa técnica envolve a extração de dados de modelos maiores para treinar os menores, o que viola os Termos de Serviço da OpenAI. A Openai enfatizou seu compromisso de proteger sua propriedade intelectual e trabalhar com o governo dos EUA para proteger os modelos avançados de IA do uso adversário.
David Sacks, o Czar da AI do presidente Trump, destacou a questão da Fox News, sugerindo que as empresas de IA dos EUA tomariam medidas para evitar essa destilação nos próximos meses. A ironia da situação não foi perdida para os observadores, com o RP e o escritor de tecnologia Ed Zitron apontando a própria história do OpenAi de usar conteúdo da Internet protegido por direitos autorais para treinar o ChatGPT.
Em janeiro de 2024, o OpenAI reconheceu a necessidade de usar materiais protegidos por direitos autorais para treinar grandes modelos de idiomas como o ChatGPT. Em uma submissão ao Comitê de Comunicações e Selectões Digital da Câmara do Reino Unido, o OpenAI argumentou que a exclusão de materiais protegidos por direitos autorais limitaria severamente as capacidades dos sistemas modernos de IA. Essa posição alimentou debates em andamento sobre a ética e a legalidade do treinamento da IA em conteúdo protegido por direitos autorais, destacados por ações judiciais como a apresentada pelo New York Times contra o Openai e a Microsoft em dezembro de 2023 para "uso ilegal" de seu conteúdo. O Openai respondeu defendendo a prática como "uso justo" e afirmando a falta de mérito do processo.
A controvérsia se estende além das organizações de notícias, com um processo de 17 autores, incluindo George RR Martin, arquivado em setembro de 2023, alegando "roubo sistemático em escala de massa". Além disso, uma decisão de um escritório de direitos autorais dos EUA confirmada pelo juiz distrital Beryl Howell, em agosto do ano anterior, afirmou que a arte gerada pela IA não pode ser protegida por direitos autorais, enfatizando a importância da criatividade humana na lei de direitos autorais.
A Deepseek é acusada de usar o modelo do OpenAI para treinar seu concorrente usando a destilação. Crédito da imagem: Andrey Rudakov/Bloomberg via Getty Images.