Xiaomi Robotics 0: modello VLA open source
Xiaomi entra in modo più serio nel discorso robotica di nuova generazione e lo fa con una mossa interessante: Xiaomi Robotics-0, un modello VLA open source da 4,7 miliardi di parametri. VLA significa una cosa semplice: il modello vede la scena, capisce una richiesta in linguaggio naturale, poi traduce tutto in azioni che un robot può eseguire.
Non è l’ennesimo modello che descrive cosa vede, qui l’obiettivo è chiudere il cerchio: percezione, decisione, movimento; e farlo con un controllo abbastanza preciso da non restare solo teoria.
Xiaomi Robotics 0: cosa promette
Xiaomi descrive Robotics-0 come un passo verso la “physical intelligence”, cioè AI che non vive solo sullo schermo. Il modello combina tre capacità: comprensione visiva, comprensione del linguaggio e esecuzione in tempo reale: in pratica può ricevere un comando, interpretare l’ambiente e agire senza un passaggio manuale di mezzo.


Xiaomi parla anche di risultati molto forti in test e simulazioni, con prestazioni da record su più benchmark; al netto dei numeri, l’idea resta chiara: un modello che non si ferma al ragionamento, ma arriva al gesto.

Xiaomi Robotics 0: perché Xiaomi cita MoT
Un punto tecnico interessante è l’uso di una struttura chiamata Mixture-of-Transformers (MoT). In modo pratico, Xiaomi divide il lavoro tra componenti diversi, così può bilanciare due esigenze che spesso si scontrano: ragionamento ampio e controllo fine.
Questo equilibrio è fondamentale nella robotica: se un modello ragiona bene ma muove male, fallisce nella vita reale; se muove bene ma non capisce contesto e istruzioni, diventa rigido e limitato. Xiaomi dice di aver costruito la piattaforma proprio per tenere insieme entrambe le cose.
Perché l’open source cambia la partita
Rilasciare un modello del genere in open source non è solo un gesto per la community , è un acceleratore: più ricerca, più test, più varianti, più correzioni; e soprattutto più possibilità di adattamento a robot diversi, ambienti diversi, sensori diversi.
In parallelo, Xiaomi manda un segnale sul posizionamento: vuole partecipare alla corsa dei modelli “generalisti” per robot, non restare solo un integratore di hardware.
Cosa aspettarsi adesso
La parte difficile arriva dopo l’annuncio: stabilità, sicurezza, qualità dei dati, ripetibilità dei risultati. Tuttavia la direzione è quella giusta: portare AI e robotica su un piano più concreto, dove contano fluidità, affidabilità e controllo.
Se Xiaomi continuerà a investire su questo filone, la piattaforma potrebbe diventare il punto di partenza per qualcosa di più ampio; e nel 2026, con l’AI che esce dai data center e entra negli oggetti, è una scommessa che ha senso.