Il sottofondo di uno dei capolavori di John Lennon per la nuova esperienza di Google. Il colosso di Mountain View ha lanciato il motore le immagini attraverso la loro descrizione: Imagen. Appunto.
Una lettera in più rispetto a una delle canzoni più belle della storia della musica. Un sistema di intelligenza artificiale da immaginare e far provare a tutti, ma dentro certi confini, oltre ai quali non si può andare.
Google ha una nuova IA text-to-image che secondo lui batte tutti. Lo ha chiamato Chiamato Imagen. E’ un programma che prende un testo lo combina con una foto, ad esempio di un gatto persiano che indossa un cappello da cowboy e suona una chitarra su una spiaggia, con la maglietta rossa. Et voila, ecco il risultato.
Un esempio per far capire la forza di Imagen: il sistema di intelligenza artificiale che possiede il colosso di Mountain View può produrre immagini foto-realistiche o un rendering. Segue altri generatori di testo a immagine come DALL-E, VQ-GAN+CLIP e modelli di diffusione latente.
Quando gli è stato chiesto di confrontare le immagini create da Imagen e altri generatori di testo a immagine, Google ha affermato che le persone hanno scoperto che il suo modello ha superato i concorrenti in termini di precisione e fedeltà delle immagini.
Imagen elimina Photoshop: un sistema di intelligenza artificiale (dicono) senza pari
Diversi esempi sono stati condivisi: messaggi di testo e immagini risultanti create dall’IA, sul suo sito Web Imagen, comprese gemme come “Un simpatico corgi vive in una casa fatta di sushi“, ma questi potrebbero rappresentare solo i migliori risultati generati.
I modelli di apprendimento da testo a immagine mostrano la potenza dei sistemi di apprendimento automatico. In questo caso, Imagen elimina la necessità di sapere come utilizzare software specializzati come Photoshop per creare immagini astratte. I sistemi di intelligenza artificiale stanno aiutando l’azienda ad avvicinarsi alla sua visione di un futuro dell’ambiente informatico, come notato alla conferenza I/O di Google all’inizio di questo mese.
L’ambient computing è l’idea che le persone un giorno saranno in grado di utilizzare i computer in modo intuitivo, senza aver bisogno della conoscenza di sistemi o codici specifici. Il potere dell’IA da testo a immagine non è perso su Google, tuttavia, e la società ha scelto di non rilasciare Imagen al pubblico.
Il sistema di Intelligenza Artificiale cerca online info per imparare e creare immagini. Poiché Internet può essere pieno di stereotipi e pregiudizi, questi finiscono per diventare presenti su Imagen. Big G teme anche che Imagen possa essere utilizzato negativamente da cattivi attori, da qui l’idea della non fruibilità.
“I metodi generativi possono essere sfruttati per scopi dannosi, tra cui molestie e diffusione di disinformazione – scrive il team di Google – e sollevare molte preoccupazioni in merito all’esclusione sociale e culturale e ai pregiudizi“.
Google avverte gli altri produttori di intelligenza artificiale di diffidare dal rilasciare al pubblico modelli da testo a immagine senza prestare particolare attenzione alle informazioni su cui viene addestrata un’IA.