IA su Minecraft? Gioca meglio di tanti players reali, come funziona?

Bisognerebbe giocarci contro per capire la sua effettiva forza. Il mondo del gaming colpito dall’OpenAI, un intelligenza artificiale in grado di primeggiare su un videogioco sandbox open world sviluppato da Mojang Studios e creato dallo svedese Markus Persson, con ben oltre 200 milioni di copie vendute, semplicemente uno dei giochi più venduti di sempre.

Minecraft 20220626 tech
Minecraft – MeteoWeek.com

Già durante l’anno dello scoppio della pandemia OpenAI ha sbalordito le persone con un algoritmo capace di parlare e rispondere con frasi molto ben congegniate. Quest’anno, ecco DALL-E 2, un cugino di GPT-3, addestrato per testo e immagini, che ha suscitato un simile scalpore online quando ha iniziato a creare immagini surreali di astronauti a cavallo e, più recentemente, a creare strani volti fotorealistici di persone che indossano non esiste.

Ora OpenAI si spinge oltre, creando un qualcosa in grado di giocare a Minecraft dopo aver visto circa 70.000 ore di video. Rispetto ai numerosi algoritmi precedenti di Minecraft che operano in versioni “sandbox” del gioco molto più semplici, la nuova IA funziona nello stesso ambiente degli esseri umani, utilizzando comandi standard di tastiera e mouse.

Come si addestra un algoritmo

Minecraft 20220626 tech 2
Minecraft – MeteoWeek.com

In un post sul blog e in un preprint che descrive in dettaglio il lavoro, il team di OpenAI afferma che l’algoritmo ha appreso abilità di base, come abbattere alberi, creare assi e costruire tavoli da lavoro. Lo hanno osservato anche nuotare, cacciare, cucinare e saltare.
“Per quanto ne sappiamo – scrivono gli autori di questa incredibile AI – non esiste alcun lavoro pubblicato che operi nello spazio dell’azione umana completo e non modificato, che includa la gestione dell’inventario con trascinamento della selezione e la creazione di oggetti”.

Con l’addestramento del modello su un set di dati più mirato, l’algoritmo è in grado di eseguire tutti questi compiti in modo affidabile, crescendo con il passare dell’esperienza su Minecraft.

Dopo un’ulteriore messa a punto, l’eccezionale IA ha imparato a costruire un piccone di diamante, un’abilità che richiede ai giocatori umani circa 20 minuti e 24.000 azioni per essere completata.

Nella competizione MineRL Minecraft del 2019 per sviluppatori di intelligenza artificiale, ad esempio, nessuna delle 660 richieste ha raggiunto l’obiettivo relativamente semplice della competizione di estrarre diamanti. Lui sì.

Una brutta notizia per gli organizzatori di MineRL, che hanno deciso di porre limiti severi ai partecipanti: gli è stata concessa una GPU NVIDIA e 1.000 ore di gioco registrato. Sebbene i concorrenti si siano comportati in modo ammirevole, il risultato OpenAI, ottenuto con più dati e 720 GPU NVIDIA, ha fatto molto meglio dei suoi pari, umani.

Con il suo algoritmo di pre-allenamento video (VPT) per Minecraft, OpenAI è tornato all’approccio utilizzato con GPT-3 e DALL-E: pre-addestrare un algoritmo su un enorme set di dati di contenuti creati dall’uomo. Ma il successo dell’algoritmo non è stato consentito dalla potenza di calcolo o dai soli dati.

Le riprese video non elaborate non sono utili per le IA comportamentali come lo sono per i generatori di contenuti come GPT-3 e DALL-E. Mostra cosa fanno le persone, ma non spiega come lo fanno. Affinché l’algoritmo colleghi il video alle azioni, ha bisogno di etichette. Questo approccio degli esseri umani che addestrano un algoritmo di etichettatura dei dati per sbloccare i set di dati comportamentali online può aiutare l’IA ad apprendere anche altre abilità. Che vanno ben oltre quello di giocare a Minecraft.

FONTE