Google Gemini Veo: la generazione video ora usa fino a tre immagini guida
L’ultimo aggiornamento di Google Gemini Veo segna un passo importante nella generazione video basata sull’intelligenza artificiale. La nuova funzione permette di caricare fino a tre immagini per guidare Veo, riducendo il bisogno di prompt lunghi e complessi e rendendo l’esperienza più intuitiva per chi crea contenuti.
Inoltre, la novità consolida l’approccio multimodale dell’app Gemini, che sta diventando sempre più centrale nella strategia Google. L’obiettivo è semplificare la fase creativa mantenendo al tempo stesso un risultato coerente e visivamente stabile.
Google Gemini Veo: come funziona il nuovo sistema di immagini guida
In passato, generare video con Google Gemini Veo richiedeva prompt estremamente dettagliati per ottenere coerenza nei personaggi, nello stile e negli ambienti. Ora, invece, l’utente può caricare immagini che fungono da riferimento diretto per il modello.
Questa impostazione permette a Veo di interpretare con maggiore precisione ciò che l’utente immagina. Le immagini possono rappresentare:
- volti o personaggi da mantenere identici;
- oggetti specifici da inserire nella scena;
- stili visivi, illuminazioni o texture;
- ambienti e scenari da replicare nel video finale.
Questa scelta riduce drasticamente la necessità di descrizioni lunghe, perché il modello “legge” dalle foto ciò che prima richiedeva molte righe di testo.
Personaggi coerenti, stile stabile e world-building: cosa migliora
L’introduzione delle immagini guida cambia soprattutto tre aspetti della generazione video.
Coerenza dei personaggi
Uno dei limiti più comuni dei modelli video è la difficoltà nel mantenere invariati i tratti di un personaggio lungo la clip. Con Google Gemini Veo, caricare una foto chiara del volto permette al sistema di replicarlo con maggiore precisione.
Stile visivo uniforme
Texture, palette cromatiche, illuminazione e persino l’atmosfera generale del video possono ora derivare da un’immagine fornita dall’utente. Questo consente una resa estetica molto più controllata rispetto al passato.
World-building più solido
Gli utenti possono guidare Veo nella costruzione di ambienti coerenti: città futuristiche, scenari naturali o interni complessi possono essere riprodotti con uno stile più stabile grazie alla foto di riferimento.
Google ha mostrato un esempio in cui tre immagini vengono combinate per inserire i personaggi rappresentati all’interno della scena descritta dal prompt. Il risultato, secondo le dimostrazioni ufficiali, è un video più coerente, con transizioni visive più fluide e una migliore integrazione dei soggetti.

Aggiornamento del menu Tools e nuova versione del modello Veo 3.1
Il rollout della funzione arriva insieme a un aggiornamento del menu Tools, rinnovato su Android e iOS per indicare chiaramente quale modello viene impiegato durante la generazione video.
Per questa funzione, Google utilizza Veo 3.1, una versione migliorata che ha già introdotto:
- animazioni più fluide e pulite;
- maggiore controllo sul movimento degli oggetti;
- stabilità superiore nella generazione di sequenze dinamiche;
- riduzione degli artefatti nelle transizioni tra scene.
Il tutto inserito in un’interfaccia che punta a essere semplice per i principianti ma completa per i creativi più esperti.
Disponibilità: rollout in corso per i piani premium
L’aggiornamento è già in distribuzione e raggiungerà tutti gli utenti nel corso della prossima settimana. La funzione è disponibile esclusivamente per gli abbonati ai piani:
- Google AI Plus
- Google AI Pro
- Google AI Ultra
Questa decisione segue la strategia recente di Google: concentrare le funzioni più avanzate nelle fasce premium, mentre la versione gratuita dell’app mantiene strumenti più essenziali.
Google Gemini Veo: un aggiornamento che cambia il modo di creare video
Il nuovo sistema basato su immagini guida rende Google Gemini Veo uno strumento molto più potente e accessibile.
La possibilità di controllare personaggi, stile e ambienti con tre semplici fotografie permette di accelerare la fase creativa e ottenere risultati molto più coerenti. Inoltre, l’integrazione con il modello Veo 3.1 consolida la qualità della generazione video, portando l’esperienza a un livello più professionale.
Per chi crea contenuti e lavora con l’AI, questo aggiornamento rappresenta una delle evoluzioni più significative mai introdotte nell’app Gemini.