Openai sospetta che i modelli di AI Deepseek della Cina, significativamente più economici delle alternative occidentali come Chatgpt, siano state sviluppate utilizzando i dati OpenAI. Questa rivelazione, unita al rapido aumento della popolarità di Deepseek, ha scatenato una recessione del mercato azionario per i principali attori dell'IA. NVIDIA, un fornitore chiave della GPU per l'IA, ha registrato anche la sua più grande perdita di un giorno, mentre anche Microsoft, Meta, Alphabet e Dell hanno visto gocce significative.
Il modello R1 di DeepSeek, basato sull'apertura open source DeepSeek-V3, vanta costi di allenamento significativamente più bassi (stimati in $ 6 milioni) e requisiti computazionali rispetto alle controparti occidentali. Sebbene questa affermazione sia contestata da alcuni, ha alimentato le preoccupazioni degli investitori per i massicci investimenti effettuati dalle società tecnologiche americane in AI.
Openai e Microsoft stanno studiando se DeepSeek abbia violato i termini di servizio di Openai utilizzando una tecnica chiamata "Distillazione" - estrarre dati da modelli più grandi per addestrare quelli più piccoli - per integrare i modelli AI di Openai in DeepSeek. Openi riconosce che le aziende cinesi e altri cercano attivamente di replicare i modelli di AI conducente e stanno prendendo contromisure per proteggere la loro proprietà intellettuale. David Sacks, lo zar di AI del presidente Trump, ha confermato prove che suggeriscono l'uso da parte di Deepseek dei modelli OpenAI.
Questa situazione evidenzia l'ironia delle accuse di Openi, date le proprie controversie passate. Openai in precedenza aveva sostenuto che la creazione di strumenti di intelligenza artificiale come Chatgpt è impossibile senza usare materiale protetto da copyright, una posizione supportata dalla loro sottomissione alla House of Lords del Regno Unito. Questa posizione è ulteriormente complicata dalle azioni legali del New York Times e di 17 autori che sostengono violazione del copyright di Openai e Microsoft. Il dibattito in corso che circonda l'uso di materiale protetto da copyright nell'addestramento dell'IA sottolinea una sfida critica che deve affrontare il paesaggio generativo in rapida evoluzione dell'IA.