Google amplia i suoi strumenti di intelligenza artificiale generativa con due nuovi modelli: Imagen 3 e Veo. Se Gemini si diletta perlopiù con i contenuti testuali, questi due modelli di linguaggio sono specializzati rispettivamente nella generazione di immagini e video animati. Il primo infatti può generare immagini sulla base di prompt testuali, mentre il secondo può animare immagini fornite dall’utente.
Imagen 3 è il successore di Imagen 2 e lo surclassa per livello di dettaglio, luci e riduzione degli artefatti nelle immagini. Le immagini realizzate infatti sono molto realistiche e dettagliate, delle vere e proprie opere d’arte. Sarà disponibile da questa settimana per tutti gli utenti della piattaforma Vertex AI di Google.
Veo, da ora disponibile in anteprima, si occupa di animare immagini statiche e può anche generare video da zero a partire da un semplice prompt testuale. I contenuti realizzati da Imagen 3 e Veo saranno contrassegnati con SynthID di DeepMind che fungerà da watermark per poter riconoscere che sono realizzati tramite intelligenza artificiale, in modo tale che non verranno mai spacciati per contenuti reali e quindi utilizzati per manipolare le persone. Inoltre Google garantisce che l’IA non potrà essere utilizzata per creare contenuti dannosi, e che i dati dei clienti non verranno mai utilizzati per allenare l’IA.