DeepSeek V3.1: nuovo modello AI da 685 miliardi di parametri con 128K token
DeepSeek V3.1: il nuovo modello AI open source da 685 miliardi di parametri
DeepSeek, una delle realtà cinesi più avanzate nel campo dell’intelligenza artificiale generativa, ha annunciato in silenzio il rilascio del suo nuovo modello linguistico DeepSeek V3.1.
L’annuncio è arrivato il 19 agosto, attraverso il gruppo utenti WeChat dell’azienda, senza comunicati ufficiali o post pubblici. Nonostante il basso profilo, la nuova versione introduce due cambiamenti significativi: una finestra di contesto estesa a 128.000 token e 685 miliardi di parametri gestiti tramite architettura Mixture-of-Experts.
Un aggiornamento tecnico importante, che rafforza la posizione di DeepSeek tra i protagonisti del panorama AI open source.
Più contesto, più potenza: cosa cambia in DeepSeek V3.1
Il cambiamento più rilevante è l’ampliamento della finestra di contesto. Con 128.000 token disponibili, DeepSeek V3.1 può elaborare l’equivalente di un libro da 300-400 pagine in un singolo prompt.
Questo rende il modello ideale per:
- generazione di contenuti estesi
- analisi di documenti tecnici
- conversazioni AI a più turni
Secondo quanto riferito, il supporto per questa finestra allargata era già presente nella precedente V3, ma è stato ora attivato in modo ufficiale su tutte le interfacce di accesso, incluse API e distribuzioni su Hugging Face, dove il modello è disponibile con licenza MIT.
Dal punto di vista architetturale, DeepSeek mantiene la struttura MoE (Mixture-of-Experts): su 685 miliardi di parametri totali, solo 37 miliardi vengono attivati per token, ottimizzando le prestazioni e i consumi.
Il supporto ai formati di precisione BF16, FP8 e F32 garantisce flessibilità di utilizzo in diversi ambienti di deployment, dal cloud ai dispositivi on-premise.
Benchmark solidi, ma il modello R2 resta in sospeso
Nei test di terze parti, DeepSeek V3.1 ha dimostrato un netto miglioramento rispetto alla versione precedente.
- Nel test di codifica Aider, ha raggiunto il 71,6%, superando modelli noti come Claude Opus 4.
- In compiti di matematica e logica, il nuovo modello ha mostrato una maggiore coerenza.
- Tuttavia, alcuni utenti esperti segnalano che le capacità di ragionamento profondo non hanno ancora fatto un salto qualitativo evidente rispetto al modello R1-0528.
Curiosamente, proprio il modello R1 è stato rimosso dall’interfaccia del chatbot DeepSeek, segnalando una strategia di consolidamento: un unico modello ibrido, V3.1, ora gestisce sia il ragionamento che le interazioni standard.
Un cambio forzato dalla geopolitica AI?
Dietro le quinte, la situazione è meno lineare. Il modello DeepSeek R2, atteso come prossimo passo evolutivo sul fronte del ragionamento, non è ancora pronto.
Secondo fonti citate dal Financial Times, il ritardo è legato a problemi con i chip Ascend AI di Huawei, scelti per ridurre la dipendenza da GPU Nvidia.
Nonostante il supporto diretto degli ingegneri Huawei, l’addestramento completo su Ascend non è andato a buon fine. Il modello V3 originale, infatti, è stato addestrato su 2,788 milioni di ore GPU usando chip Nvidia H800, con un costo stimato intorno ai 5,6 milioni di dollari.
La V3.1 nasce da quella base tecnica, con affinamenti interni, ma resta comunque fortemente legata all’infrastruttura Nvidia per il training. Ascend viene usato solo per l’inferenza, una soluzione ibrida che ha creato nuove complessità operative.
Tra potenzialità e pressioni: quale futuro per DeepSeek?
La storia di DeepSeek V3.1 è emblematica del momento attuale dell’AI in Cina. Da un lato, modelli avanzati e open source che competono con i migliori progetti occidentali. Dall’altro, pressioni politiche e vincoli tecnici che rallentano l’innovazione.
Il fondatore Liang Wenfeng avrebbe espresso frustrazione per i ritardi accumulati nello sviluppo della serie R. L’etichettatura dei dati, i problemi di compatibilità e l’obbligo di usare chip nazionali hanno creato un percorso a ostacoli, mentre competitor come Qwen3 di Alibaba avanzano con maggiore rapidità.
Nonostante tutto, DeepSeek non ha abbandonato il progetto R2, che potrebbe arrivare più avanti. Quando verrà rilasciato, però, sarà sottoposto a un’attenta valutazione pubblica.
Nel frattempo, DeepSeek V3.1 resta il modello di punta, capace di sostenere sia compiti di reasoning che interazioni generative su larga scala, con una finestra di contesto tra le più ampie sul mercato.