De ce AI-urile sunt derutate de unele jocuri?
Un studiu recent a evidențiat modul în care AI-urile, inclusiv cele dezvoltate de DeepMind, întâmpină dificultăți în a juca jocuri simple precum Nim, comparativ cu jocuri complexe precum șahul și Go, unde au excelat. Potrivit arstechnica.com, această problemă subliniază limitele metodei de antrenare folosite pentru AI-uri și modul în care acestea pot dezvolta "zone oarbe".
👉 Metoda Alpha pentru jocuri și limitările sale
Cu seria sa de AI-uri pentru jocuri Alpha, grupul DeepMind de la Google părea să fi găsit o metodă prin care AI-urile să abordeze orice joc, stăpânind jocuri precum șahul și Go prin repetarea jocului cu ele însele în timpul antrenamentului. Totuși, au apărut situații ciudate când jucătorii au început să identifice poziții în Go care pierdeau în fața unor noi veniți, dar care înfruntau cu ușurință un AI similar. Deși a învinge un AI la un joc de masă poate părea relativ trivial, acest lucru ne poate ajuta să identificăm moduri de eșec ale AI-ului sau metode prin care putem îmbunătăți antrenamentul acestora pentru a evita dezvoltarea acestor zone oarbe, ceea ce poate deveni crucial pe măsură ce oamenii se bazează pe contribuțiile AI în fața unui număr tot mai mare de probleme.
👉 Caracteristici și dificultăți ale jocului Nim pentru AI-uri
Un articol recent publicat în Machine Learning descrie o întreagă categorie de jocuri unde metoda utilizată pentru a antrena AlphaGo și AlphaChess eșuează. Jocul în discuție, Nim, implică doi jucători care își iau turele pentru a îndepărta bețigașe de pe un tabel în formă de piramidă până când unul dintre ei nu mai are o mișcare legală. Nim implică configurarea unui set de rânduri de bețigașe, cu rândul de sus având un singur bețișor, iar fiecare rând de dedesubt având cu două mai mult decât cel deasupra.
Importanța lui Nim provine dintr-o teoremă care arată că orice poziție într-un joc imparțial poate fi reprezentată printr-o configurație a unei piramide Nim. Aceasta înseamnă că dacă ceva se aplică la Nim, se aplică tuturor jocurilor imparțiale. Una dintre caracteristicile distincte ale Nim și ale altor jocuri imparțiale este că, în orice moment al jocului, este ușor să evaluezi tabla și să determini care jucător are potențialul de a câștiga. Cu alte cuvinte, poți evalua tabla și să știi că, dacă joci cele mai bune mutări de aici înainte, este foarte probabil că vei câștiga.
👉 Dificultăți ale AI-ului în învățarea și aplicarea regulilor Nim
Noul studiu realizat de Bei Zhou și Soren Riis pune o întrebare simplă: Ce se întâmplă dacă aplici abordarea AlphaGo în antrenarea unei AI pentru a juca Nim? Ei au descoperit că procesul de antrenare care a funcționat bine pentru șah ar putea să nu fie eficace pentru Nim. Zhou și Riis au concluzionat că Nim necesită ca jucătorii să învețe funcția de paritate pentru a juca eficient, iar metoda de antrenament care a dovedit eficiență în șah și Go nu poate face acest lucru.
De exemplu, pe un tabel de Nim cu cinci rânduri, AI-ul a progresat rapid, dar, odată cu adăugarea unui rând suplimentar, viteza de îmbunătățire a scăzut dramatic. Pe un tabel cu șapte rânduri, câștigurile în performanță s-au oprit aproape complet după 500 de jocuri. Cercetătorii au descoperit că sistemul nu putea învăța să evalueze rezultatele jocurilor la un număr mai mare de rânduri, evaluând toate mutările posibile ca fiind echivalente.
Aceste descoperiri sugerează că problemele similare ar putea apărea și în cazul AI-urilor care joacă șah, și că AI-urile AlphaZero excelează în învățarea prin asociere, dar eșuează atunci când o problemă necesită o formă de raționare simbolică care nu poate fi învățată implicit din corelația dintre stările de joc și rezultate.