Ecco la magia di Google: possiamo aumentare la risoluzione delle immagini di bassa qualità.
Per ogni problema c’è sempre una “risoluzione”. Anzi, una “super-risoluzione”.
Quante volte abbiamo rinunciato a pubblicare o semplicemente usare un’immagine perché troppo “sgranata”? Google è ora al lavoro per sviluppare una tecnica di sicuro interesse per tutti noi. Una “magia” con cui potremo migliorare notevolmente la risoluzione delle immagini di bassa qualità con l’aiuto dell’intelligenza artificiale.
Ad oggi i programmi di elaborazione di foto e immagini dispongono di svariati metodi ed algoritmi di upscaling, in grado cioè di aumentare la risoluzione dell’immagine senza che la qualità ne risulti particolarmente compromessa.
Ma Google alza l’asticella e promette incredibili cambiamenti nel campo della super-risoluzione. In un blog ufficiale, Google ha mostrato come l’aumento della risoluzione di un ritratto da 64 x 64 pixel alla ben più elevata qualità di 1024 x 1024.
LEGGI ANCHE: Google Pixel Watch, le prime immagini: ma quando esce?
Come spesso capita però, dietro un utilizzo facile di uno strumento, spesso si cela molta complessità, dedizione e studio.
Infatti, il processo di raffinamento della risoluzione si chiama SR3 (Super-Resolution via Repeated Refinements), una strategia che consiste nell’applicare rumore gaussiano a una immagine a bassa risoluzione finché non si trasforma in rumore puro.
Poi è la volta dell’intelligenza artificiale. Questa utilizza le tecnologie di riduzione del rumore per invertire il processo di corruzione dell’immagine, rimuovendo gradualmente il rumore e ottenendo così la stessa immagine, ma con una definizione e una qualità decisamente maggiori.
Questo modello va di fatto ad operare una “corruzione” dei dati di addestramento aggiungendo progressivamente rumore gaussiano, cancellando lentamente i dettagli fino a quando l’immagine non diventa composta da rumore puro.
Quest’ultima procedura prende il nome di “conditioning augmentation” e il modello di riferimento è chiamato Cascaded Diffusion Models (CDM).
LEGGI ANCHE: Google Maps sta per introdurre una funzione utilissima anche alle nostre tasche
Per semplificare, si tratta di un particolare modello che, dato come input un’immagine a bassa risoluzione, ricostruisce un’immagine ad alta risoluzione corrispondente dal rumore puro.
I ricercatori di Google hanno condotto dei test utilizzando il modello computazionale prendendo a campione immagini di alta qualità, tutte alterate con tale procedura di degradazione.
La tecnica permette di ricostruire da zero un’ immagine quasi priva di rumore con una risoluzione quattro volte più alta dell’ originale.
Google riferisce inoltre che questa nuova tecnologia offre il massimo delle prestazioni per immagini di volti e di elementi naturali, quando il ridimensionamento è di quattro o otto volte superiore all’immagine originale.
Punto interessante è che i modelli a super-risoluzione possono essere concatenati per incrementare ulteriormente le capacità di upscaling: un modello per il passaggio da 64×64 a 256×256 e uno per il passaggio da 256×256 a 1024×1024.
Qui di seguito proponiamo un breve video rendering che mostra il sostanziale cambiamento.
Infine, Google ha affermato che l’intelligenza artificiale di cui si serve è la più potente mai sviluppata fino ad oggi. Il futuro poi è molto ambizioso: a lungo termine potrà essere utilizzata per migliorare vecchie foto di famiglia, restaurare dipinti in fase di degradazione o potrebbe risultare molto utile anche in ambito medico.