News

Facebook migliora la descrizione delle foto con l’intelligenza artificiale

Facebook migliora l’intelligenza artificiale della propria funzione AAT, dedicata alle persone non vedenti o ipovedenti: e la descrizione delle foto non è mai stata così completa

Una descrizione fornita dalla funzione AAT su Instagram – MeteoWeek.com | fonte: About Facebook

Quando gli utenti di Facebook scorrono il loro feed di notizie, si imbattono in molteplici tipi di contenuti: articoli, commenti di amici, inviti a eventi e, naturalmente, foto. La maggior parte delle persone è in grado di vedere immediatamente il contenuto di queste immagini, eppure non è così per tutti. Fortunatamente, anche molti utenti non vedenti o ipovedenti possono “capire” quell’immagine, a condizione che essa sia contrassegnata con un “testo alternativo”. Uno screen reader può infatti descrivere il contenuto di queste immagini utilizzando una voce sintetica, consentendo a chiunque di comprendere le immagini presenti su Facebook.

La AAT e il suo miglioramento

Tuttavia, moltissime immagini vengono pubblicate senza testo alternativo: per questo, nel 2016, Facebook ha introdotto una nuova tecnologia, l’AAT (Automatic Alternative Text) o “testo alternativo automatico”. Essa è basata sull’intelligenza artificiale e, utilizzando il riconoscimento degli oggetti, è in grado di generare descrizioni di foto, in modo che le persone non vedenti o ipovedenti possano godersi pienamente il proprio feed di notizie su Facebook.

Leggi anche:

Ma l’azienda di Mark Zuckerberg continua a guardare avanti, in quanto ha da poco annunciato il miglioramento della propria funzione AAT. La nuova generazione di AAT migliora di 10 volte la capacità di analisi e la descrizione delle foto: in questo modo Facebook assicura che le foto prive di essa saranno sempre meno. Le descrizioni sono quindi più dettagliate, con la possibilità di identificare attività, punti di riferimento, tipi di animali e così via. Un esempio lo evidenzia Facebook stesso, come visibile nell’immagine sottostante.

Una descrizione di un’immagine fornita dall’AAT aggiornata di Facebook: l’intelligenza artificiale riconosce maggiori dettagli della foto – MeteoWeek.com | fonte: About Facebook

Al posto di: “Può essere un’immagine di 5 persone”, la nuova descrizione in seguito al miglioramento della AAT è la seguente: “Può essere un’immagine di 5 persone che suonano strumenti musicali, compreso Jay Youmens, le persone sono in piedi, 2 cappelli e 5 tamburi”. Di fatto, questi progressi aiutano gli utenti non vedenti o ipovedenti a capire meglio cosa c’è nelle foto pubblicate da familiari e amici su Facebook (nonché nelle loro stesse foto): il tutto grazie all’intelligenza artificiale. I vari miglioramenti hanno permesso di riconoscere oltre 1.200 concetti e le descrizioni sono oggi disponibili in 45 lingue diverse.

Le nuove descrizioni “scritte” relative ad una foto – MeteoWeek.com | fonte: About Facebook

Ma non è finita qui, perché anche il pannello di descrizione della foto è chiaramente migliorato, come visibile nell’immagine sopra. Le nuove descrizioni dettagliate includono anche semplici informazioni sulla posizione – in alto / al centro / in basso o a sinistra / al centro / a destra – e un confronto della prominenza degli oggetti, descritti come “primari”, “secondari” o “minori”. Queste parole sono state scelte appositamente per ridurre al minimo l’ambiguità: infatti, i feedback riguardo questa funzione – durante lo sviluppo – hanno mostrato che l’utilizzo di una parola come “grande” per descrivere un oggetto potrebbe creare confusione, in quanto non è chiaro se il riferimento è alla sua dimensione effettiva o alla sua dimensione rispetto ad altri oggetti presenti in un’immagine. Infatti, basti pensare che anche un cane di piccola taglia può sembrare “grande” se fotografato da vicino.

Federico Mirra