DGX Spark di Nvidia: gli utenti segnalano limiti e cali rispetto alle attese

DGX Spark di Nvidia: gli utenti segnalano limiti e cali rispetto alle attese

La console DGX Spark di Nvidia — presentata come soluzione da 1 petaflop per inferenza AI — sta generando dubbi tra gli utenti.
Secondo segnalazioni emerse su forum e nei commenti di sviluppatori come John Carmack, le prestazioni reali risultano sensibilmente inferiori alle aspettative.
In particolare, Carmack ha scritto che il sistema sembra bloccarsi a circa 100 W di consumo, rispetto ai 240 W dichiarati.

DGX Spark : limiti di consumo e raffreddamento

Una delle principali criticità riguarda il consumo effettivo e la gestione termica:

  • I test indipendenti segnalano un consumo sotto carico combinato (CPU+GPU) intorno ai 200 W, comunque inferiore alla soglia massima garantita.
  • Alcuni utenti riportano riavvii spontanei durante operazioni prolungate.
    Tali evidenze mettono in discussione le specifiche ufficiali e portano a ritenere che un throttling firmware o termico possa essere attivo per proteggere il sistema.

Perché le prestazioni reali di DGX Spark sono inferiori alle attese

La piattaforma DGX Spark è costruita attorno al superchip GB10 (o N1) con memoria unificata LPDDR5x da 128 GB.
Tuttavia, nonostante i numeri appariscano elevati, gli utenti rilevano che le prestazioni reali scendono a causa di:

  • Bassa larghezza di banda memoria: circa 273 GB/s, che limita il throughput in operazioni decode su modelli LLM molto grandi.
  • Architettura ottimizzata per modelli molto grandi in memoria piuttosto che per latenza o velocità di token generati.
    In sintesi, DGX Spark potrebbe eccellere nel gestire grandi modelli, ma offre prestazioni inferiori in ambiti dove contano token/sec e generazione rapida.

Quali utenti dovrebbero valutarla

Se cerchi una workstation compatta capace di caricare modelli da 200 miliardi di parametri in locale, allora DGX Spark è un’ottima scelta.
Se invece l’obiettivo è massima velocità di inferenza token-per-token o allenamento intensivo, le prestazioni reali potrebbero non giustificare il prezzo. In questi casi soluzioni multi-GPU tradizionali o alternative AMD/Apple potrebbero dare più valore.

Cosa succede ora

Nvidia non ha ancora rilasciato un commento ufficiale che risolva queste segnalazioni.
La comunità sviluppatori resta vigile: le prestazioni reali di DGX Spark sono oggetto di confronto, benchmark e testimonianze dirette.
Il futuro dell’AI on-device dipenderà non solo dalle specifiche hardware, ma dalla capacità di tradurle in valore tangibile.

Lascia un commento