Facebook migliora l’intelligenza artificiale della propria funzione AAT, dedicata alle persone non vedenti o ipovedenti: e la descrizione delle foto non è mai stata così completa
Quando gli utenti di Facebook scorrono il loro feed di notizie, si imbattono in molteplici tipi di contenuti: articoli, commenti di amici, inviti a eventi e, naturalmente, foto. La maggior parte delle persone è in grado di vedere immediatamente il contenuto di queste immagini, eppure non è così per tutti. Fortunatamente, anche molti utenti non vedenti o ipovedenti possono “capire” quell’immagine, a condizione che essa sia contrassegnata con un “testo alternativo”. Uno screen reader può infatti descrivere il contenuto di queste immagini utilizzando una voce sintetica, consentendo a chiunque di comprendere le immagini presenti su Facebook.
La AAT e il suo miglioramento
Tuttavia, moltissime immagini vengono pubblicate senza testo alternativo: per questo, nel 2016, Facebook ha introdotto una nuova tecnologia, l’AAT (Automatic Alternative Text) o “testo alternativo automatico”. Essa è basata sull’intelligenza artificiale e, utilizzando il riconoscimento degli oggetti, è in grado di generare descrizioni di foto, in modo che le persone non vedenti o ipovedenti possano godersi pienamente il proprio feed di notizie su Facebook.
Leggi anche:
- Facebook dice addio ai “Mi piace” alle pagine: il motivo
- Le migliori app per modificare immagini e renderle ‘a prova di social’
Ma l’azienda di Mark Zuckerberg continua a guardare avanti, in quanto ha da poco annunciato il miglioramento della propria funzione AAT. La nuova generazione di AAT migliora di 10 volte la capacità di analisi e la descrizione delle foto: in questo modo Facebook assicura che le foto prive di essa saranno sempre meno. Le descrizioni sono quindi più dettagliate, con la possibilità di identificare attività, punti di riferimento, tipi di animali e così via. Un esempio lo evidenzia Facebook stesso, come visibile nell’immagine sottostante.
Al posto di: “Può essere un’immagine di 5 persone”, la nuova descrizione in seguito al miglioramento della AAT è la seguente: “Può essere un’immagine di 5 persone che suonano strumenti musicali, compreso Jay Youmens, le persone sono in piedi, 2 cappelli e 5 tamburi”. Di fatto, questi progressi aiutano gli utenti non vedenti o ipovedenti a capire meglio cosa c’è nelle foto pubblicate da familiari e amici su Facebook (nonché nelle loro stesse foto): il tutto grazie all’intelligenza artificiale. I vari miglioramenti hanno permesso di riconoscere oltre 1.200 concetti e le descrizioni sono oggi disponibili in 45 lingue diverse.
Ma non è finita qui, perché anche il pannello di descrizione della foto è chiaramente migliorato, come visibile nell’immagine sopra. Le nuove descrizioni dettagliate includono anche semplici informazioni sulla posizione – in alto / al centro / in basso o a sinistra / al centro / a destra – e un confronto della prominenza degli oggetti, descritti come “primari”, “secondari” o “minori”. Queste parole sono state scelte appositamente per ridurre al minimo l’ambiguità: infatti, i feedback riguardo questa funzione – durante lo sviluppo – hanno mostrato che l’utilizzo di una parola come “grande” per descrivere un oggetto potrebbe creare confusione, in quanto non è chiaro se il riferimento è alla sua dimensione effettiva o alla sua dimensione rispetto ad altri oggetti presenti in un’immagine. Infatti, basti pensare che anche un cane di piccola taglia può sembrare “grande” se fotografato da vicino.