Facebook migliora l’intelligenza artificiale della propria funzione AAT, dedicata alle persone non vedenti o ipovedenti: e la descrizione delle foto non è mai stata così completa
Quando gli utenti di Facebook scorrono il loro feed di notizie, si imbattono in molteplici tipi di contenuti: articoli, commenti di amici, inviti a eventi e, naturalmente, foto. La maggior parte delle persone è in grado di vedere immediatamente il contenuto di queste immagini, eppure non è così per tutti. Fortunatamente, anche molti utenti non vedenti o ipovedenti possono “capire” quell’immagine, a condizione che essa sia contrassegnata con un “testo alternativo”. Uno screen reader può infatti descrivere il contenuto di queste immagini utilizzando una voce sintetica, consentendo a chiunque di comprendere le immagini presenti su Facebook.
Tuttavia, moltissime immagini vengono pubblicate senza testo alternativo: per questo, nel 2016, Facebook ha introdotto una nuova tecnologia, l’AAT (Automatic Alternative Text) o “testo alternativo automatico”. Essa è basata sull’intelligenza artificiale e, utilizzando il riconoscimento degli oggetti, è in grado di generare descrizioni di foto, in modo che le persone non vedenti o ipovedenti possano godersi pienamente il proprio feed di notizie su Facebook.
Leggi anche:
Ma l’azienda di Mark Zuckerberg continua a guardare avanti, in quanto ha da poco annunciato il miglioramento della propria funzione AAT. La nuova generazione di AAT migliora di 10 volte la capacità di analisi e la descrizione delle foto: in questo modo Facebook assicura che le foto prive di essa saranno sempre meno. Le descrizioni sono quindi più dettagliate, con la possibilità di identificare attività, punti di riferimento, tipi di animali e così via. Un esempio lo evidenzia Facebook stesso, come visibile nell’immagine sottostante.
Al posto di: “Può essere un’immagine di 5 persone”, la nuova descrizione in seguito al miglioramento della AAT è la seguente: “Può essere un’immagine di 5 persone che suonano strumenti musicali, compreso Jay Youmens, le persone sono in piedi, 2 cappelli e 5 tamburi”. Di fatto, questi progressi aiutano gli utenti non vedenti o ipovedenti a capire meglio cosa c’è nelle foto pubblicate da familiari e amici su Facebook (nonché nelle loro stesse foto): il tutto grazie all’intelligenza artificiale. I vari miglioramenti hanno permesso di riconoscere oltre 1.200 concetti e le descrizioni sono oggi disponibili in 45 lingue diverse.
Ma non è finita qui, perché anche il pannello di descrizione della foto è chiaramente migliorato, come visibile nell’immagine sopra. Le nuove descrizioni dettagliate includono anche semplici informazioni sulla posizione – in alto / al centro / in basso o a sinistra / al centro / a destra – e un confronto della prominenza degli oggetti, descritti come “primari”, “secondari” o “minori”. Queste parole sono state scelte appositamente per ridurre al minimo l’ambiguità: infatti, i feedback riguardo questa funzione – durante lo sviluppo – hanno mostrato che l’utilizzo di una parola come “grande” per descrivere un oggetto potrebbe creare confusione, in quanto non è chiaro se il riferimento è alla sua dimensione effettiva o alla sua dimensione rispetto ad altri oggetti presenti in un’immagine. Infatti, basti pensare che anche un cane di piccola taglia può sembrare “grande” se fotografato da vicino.
Avete mai visto una televisione così particolare come questa? Probabilmente no, ma intanto è tra…
The Sims 4 riceve un update decisamente importante, il quale era atteso da molti giocatori…
L'applicazione di SmartThings Find ha appena raggiunto dei numeri da record che non possono essere…
SpaceX ha scelto di rendere ancora più efficiente il suo servizio migliorandolo di moltissimo, e…
Mai più file alla cassa del supermercato grazie ad Amazon ed al nuovo servizio Dash…
L'Xbox Series X che tutti noi conosciamo potrebbe essere in grado di garantirci un tipo…