Deepseek, sfida ai giganti dell'AI

Deepseek, sfida ai giganti dell’AI

del Prof Paolo Poletti

Negli ultimi anni, il settore dell’intelligenza artificiale (IA) è stato dominato da colossi della Silicon Valley come OpenAI, Google e Anthropic.

Tuttavia, una nuova startup cinese, DeepSeek, ha rapidamente scosso gli equilibri, emergendo come uno dei principali protagonisti nel panorama globale dell’IA.

Con modelli avanzati e strategie di sviluppo innovative, DeepSeek non solo sfida la supremazia tecnologica statunitense, ma solleva anche interrogativi etici e geopolitici sul futuro di questa tecnologia.

L’ascesa di DeepSeek: una minaccia al predominio statunitense.

Fondata nel 2023 da Liang Wenfeng, DeepSeek ha avuto origine dall’hedge fund quantitativo cinese High-Flyer, noto per le sue strategie di trading basate sull’IA. Wenfeng ha utilizzato le risorse e l’esperienza maturate in High-Flyer per costruire modelli di IA all’avanguardia, con l’obiettivo di democratizzare l’accesso a questa tecnologia.

La svolta per DeepSeek è arrivata con il rilascio del modello V3 nel dicembre 2023, un sistema con 671 miliardi di parametri addestrato in soli 55 giorni.

Questo modello, che ha eguagliato le prestazioni di concorrenti come GPT-4 di OpenAI e Claude 3.5 di Anthropic, ha suscitato grande interesse nella comunità tecnologica.

Tuttavia, è stato il recente lancio del modello R1 a gennaio 2025 a trasformare DeepSeek in un fenomeno globale. Il modello R1 è stato progettato con una duplice innovazione: capacità di ragionamento esplicito e ricerca web in tempo reale, funzionalità assenti nei principali modelli statunitensi.

Queste caratteristiche hanno portato R1 a distinguersi su piattaforme di benchmark come Chatbot Arena, superando modelli di punta come Gemini 2.0 di Google.

Efficienza e costi ridotti: la ricetta del successo.

Uno dei fattori chiave che rendono DeepSeek una minaccia per i giganti americani è la sua efficienza nei costi.

Addestrare il modello V3 è costato circa 5,58 milioni di dollari, una cifra irrisoria rispetto ai 100 milioni o più spesi da aziende come OpenAI per modelli comparabili. Inoltre, l’inferenza* con R1 costa appena 2,19 dollari per milione di token**, contro i 60 dollari richiesti dai modelli di OpenAI.

Questa strategia permette a DeepSeek di rendere i suoi modelli open source e accessibili gratuitamente, aumentando il suo impatto globale.

Dietro questa efficienza si cela l’ingegno di DeepSeek nell’ottimizzazione software, che le ha permesso di utilizzare chip meno avanzati, come i Nvidia H800, progettati per rispettare le restrizioni statunitensi sulle esportazioni di semiconduttori verso la Cina.

L’effetto dell’ascesa di DeepSeek si è fatto sentire non solo nell’ambito tecnologico, ma anche sui mercati finanziari.

Dopo l’annuncio del modello R1, i titoli tecnologici legati all’IA e ai semiconduttori hanno subito un crollo significativo. Aziende come Nvidia, Microsoft e Alphabet hanno registrato perdite di miliardi di dollari in capitalizzazione di mercato.

In Europa, il settore tecnologico ha subito un ribasso del 5%, evidenziando la vulnerabilità delle big tech di fronte a innovazioni provenienti dalla Cina.

Nonostante la sua portata globale, DeepSeek non è immune da critiche. I suoi modelli mostrano un chiaro allineamento con le politiche del governo cinese, in particolare per quanto riguarda la moderazione dei contenuti.

Test condotti su argomenti politicamente sensibili, come le proteste di Piazza Tiananmen, hanno rivelato che l’IA evita risposte dirette o ripropone narrazioni ufficiali. Questo solleva preoccupazioni sul potenziale utilizzo di modelli open source per diffondere censura o propaganda.

Innovazione o minaccia?

DeepSeek rappresenta un caso emblematico delle tensioni geopolitiche e tecnologiche tra Cina e Stati Uniti.

Da un lato, la sua ascesa dimostra che la Cina è in grado di competere con i leader globali nel settore dell’IA, nonostante le sanzioni e le restrizioni. Dall’altro, solleva interrogativi su come bilanciare l’innovazione tecnologica con le implicazioni etiche e geopolitiche.

In un mondo in cui l’IA è sempre più centrale per l’economia e la sicurezza, il successo di DeepSeek potrebbe segnare l’inizio di una nuova era, in cui il dominio statunitense non è più garantito e la competizione globale si fa più intensa e controversa.

*Inferenza: è il processo con cui un modello di intelligenza artificiale (ad esempio, un modello linguistico come GPT) utilizza i dati in ingresso per generare un risultato (ad esempio, un testo o una risposta).

**Un token rappresenta una piccola unità di testo (parole, lettere, o simboli), usata per elaborare il testo in un modello di IA.

Digimetrica
Dal 2001 cybersecurity al servizio delle aziende
Visita il Profilo Linkedin

Deepseek, sfida ai giganti dell’AI