Umělá inteligence zažívá v posledních letech období velkého rozmachu. Její úspěchy dnes potkáváme téměř ve všech oblastech života. Podílejí se na manufakturní výrobě, personalizují obsah uživatelů internetu a řídí také nejrůznější stroje od vysavačů až po automobily. Před tím, než vědci svěří systému praktický úkol, musejí jej nejdřív řádně vycvičit a otestovat. V některých případech to znamená nechat umělou inteligenci pařit počítačové hry.

Účelem není vytvořit systém schopný porazit člověka ve hře, ale najít nový způsob pro jeho učení v komplexním prostředí s objektivně měřitelným cílem, který následně uplatní v praxi. Umělé inteligenci se pomyslně vloží do ruky gamepad a vyhodnocuje se její výkon. Videohry se ukázaly být vhodným prostředkem výuky pro strojové, nebo přesněji, zpětnovazební učení. Jedná se o typ učení, ve kterém agent umělé inteligence vykonává akce a získává z prostředí feedback o jejich úspěchu, či neúspěchu. Na základě zpětné vazby pak zachovává, nebo mění svou strategii. V podstatě stejně jako když člověk v raném stádiu svého vývoje objevuje svět.

Významným absolventem videoherní výuky je například algoritmus z produkce Intel Labs a Darmstadtské univerzity, který v ulicích hry Grand Theft Auto trénoval pravidla silničního provozu. Jednou z výhod počítačových her je, že se snaží věrohodně napodobit skutečnost. GTA proslulo svou fantastickou realističností s důrazem na detail, díky níž nemuseli vědci investovat měsíce času do budování vlastního simulátoru. Krom toho je užití virtuálního světa mnohem rychlejší, a hlavně bezpečnější, než nechat AI dělat řidičák v ulicích reálného města.

Dokonce i staré arkádové světy mají s realitou hodně společného alespoň na obecné rovině. Hrdina takové hry má jasně vymezený cíl a soubor akcí, které může vykonávat, aby se k němu přiblížil. Když hrdina zemře, znamená to negativní feedback a nutnost změnit taktiku. Arkádové hry od Atari 2600 se staly výukovým materiálem pro jeden z prvních úspěšných AI projektů společnosti DeepMind. A využívají se do dnes! Tým pod vedením Jeffa Clunea před pár dny představil světu úspěchy AI systému Go-Explore, který byl díky unikátnímu způsobu učení schopen překonat lidské hráče i další algoritmické rivaly v 55 arkádových hrách. Patřily mezi ně dokonce dvě hry, Pitfall a Montezuma´s Revenge, které se doposud žádné umělé inteligenci přechytračit nepovedlo.

Videohry jsou zábavné a i tento jednoduchý důvod se stal stěžejním pro jejich využití ve výzkumu AI. Laická veřejnost raději přijme informace o vědeckých pokrocích ve spojení se svým oblíbeným titulem než za pomoci složité matematické poučky. Vytvoření algoritmu, který poráží e-sport hráče ve StarCraftu nebo hraje Atari hry s dechberoucí efektivitou jednoznačně zaujme. Díky tomu jsou lidé vnímavější k umělé inteligenci i počítačovým hrám – tedy win-win situace pro všechny.

Zdroje: https://www.technologyreview.com/2016/09/12/157605/self-driving-cars-can-learn-a-lot-by-playing-grand-theft-auto/

https://www.technologynetworks.com/informatics/news/algorithm-racks-up-superhuman-scores-in-55-classic-atari-games

Zdroj obrázku: Alyssa Wei-Gonzalez, Pinterest