L'azienda di AI sostenuta da Alphabet sta usando giochi virtuali per aiutare le sue creazioni digitali a muoversi come gli esseri umani.
Il tentativo di DeepMind di insegnare a un'intelligenza artificiale a giocare a calcio è iniziato con un giocatore virtuale che si contorceva sul pavimento: in questo modo è stato centrato almeno un aspetto del gioco fin dal calcio d'inizio.
Individuare le logiche del calcio dalle basi come la corsa e i concetti del lavoro di squadra si è rivelato molto più impegnativo, come dimostra una nuova ricerca dell'azienda di intelligenza artificiale sostenuta da Alphabet. Imparare i fondamentali del calcio potrebbe un giorno aiutare i robot a muoversi nel nostro mondo in modo più naturale e più umano.
Un'intelligenza artificiale deve ricreare tutto ciò che fanno i giocatori umani, anche le cose a cui non pensiamo consapevolmente, come muovere con precisione ogni arto e muscolo per entrare in contatto con una palla in movimento, prendendo centinaia di decisioni al secondo. La tempistica e il controllo necessari anche per i movimenti più elementari possono essere sorprendentemente difficili da definire
Gli agenti umanoidi simulati da DeepMind sono stati modellati su esseri umani reali, con 56 punti di articolazione e un raggio di movimento limitato, il che significa che non potevano, ad esempio, ruotare l'articolazione del ginocchio con angoli impossibili, come Zlatan Ibrahimovic. Per iniziare, i ricercatori hanno semplicemente dato agli agenti un obiettivo - correre, per esempio, o calciare un pallone - e hanno lasciato che cercassero di capire come arrivarci attraverso tentativi ed errori e l'apprendimento per rinforzo, come è stato fatto in passato quando i ricercatori hanno insegnato agli umanoidi simulati a navigare in percorsi a ostacoli (con risultati comici e piuttosto innaturali).
Hanno quindi utilizzato le primitive motorie probabilistiche neurali (NPMP), un metodo di insegnamento che ha spinto il modello di intelligenza artificiale verso schemi di movimento più simili a quelli umani, nella speranza che questa conoscenza di base aiutasse a risolvere il problema di come muoversi nel campo da calcio virtuale. In pratica, il controllo motorio viene orientato verso un comportamento umano realistico, verso movimenti umani realistici, e questo viene appreso dalla cattura del movimento - in questo caso, da attori umani che giocano a calcio
È necessario trovare un "sottile equilibrio" tra l'insegnare all'intelligenza artificiale a fare le cose come le fanno gli esseri umani e il lasciarle la libertà di scoprire le proprie soluzioni ai problemi, che potrebbero essere più efficienti di quelle che escogitiamo noi stessi.
L'addestramento di base è stato seguito da esercitazioni per un solo giocatore: corsa, dribbling e calci al pallone, imitando il modo in cui gli esseri umani potrebbero imparare a praticare un nuovo sport prima di tuffarsi in una situazione di partita completa. Le ricompense per l'apprendimento erano rappresentate da azioni come seguire con successo un bersaglio senza palla o dribblare la palla vicino a un bersaglio.
L'obiettivo era quello di incoraggiare gli agenti a riutilizzare le abilità che avrebbero potuto apprendere al di fuori del contesto calcistico all'interno di un ambiente calcistico: generalizzare ed essere flessibili nel passare da una strategia di movimento all'altra.
Dopo aver addestrato i loro giocatori virtuali, è arrivato il momento delle partite: si è iniziato con partite 2v2 e 3v3 per massimizzare l'esperienza accumulata dagli agenti durante ogni turno di simulazione (e imitando il modo in cui i giovani giocatori iniziano con le partite a campo ridotto nella vita reale). I momenti salienti, che potete vedere qui, : https://youtu.be/KHMwq9pv7mg hanno l'energia caotica di un cane che insegue una palla nel parco: i giocatori non corrono tanto quanto inciampano in avanti, perennemente sul punto di cadere a terra. Quando vengono segnati dei gol, non è grazie a intricati passaggi, ma a speranzose punizioni verso l'esterno del campo e a rimbalzi simili a quelli del calcio balilla sulla parete di fondo.
Tuttavia, sebbene nelle partite gli agenti venissero premiati solo per i gol segnati, i ricercatori hanno visto rapidamente emergere proprietà come il lavoro di squadra. All'inizio dell'addestramento tutti gli agenti correvano verso la palla, ma dopo qualche giorno abbiamo visto che gli agenti si rendevano conto che uno dei loro compagni di squadra aveva il controllo della palla e si giravano e correvano verso il campo, anticipando il compagno di squadra che avrebbe cercato di segnare o forse di passare la palla. È la prima volta che si vede una tale coordinazione e un tale lavoro di squadra in un'intelligenza artificiale così complessa e veloce.
E il senso di tutto questo? Non si tratta di dominare la Coppa del Mondo di Robot; ma si sta lavorando per inserire alcune delle abilità di basso livello apprese dagli agenti nei robot fisici, per farli muovere in modi più "sicuri e naturalistici" nel mondo reale. Questo non solo per non spaventare gli esseri umani che interagiscono con loro, ma anche perché i movimenti irregolari e nervosi che possono essere prodotti dall'apprendimento non strutturato potrebbero danneggiare i robot che non sono stati ottimizzati per muoversi in quel modo, o semplicemente sprecare energia.
Alla fine, questi giocatori digitali un po' slabbrati potrebbero aiutare sia i robot che gli avatar del metaverso a muoversi in modi che sembrano più umani, anche se non ci batteranno mai a calcio