Reinforcement learning in video games

Torrents Vila, Valentí

Cita bibliogràfica -- Enllaç permanent: https://ddd.uab.cat/record/298980

Reinforcement learning in video games
Torrents Vila, Valentí
Casas Roma, Jordi,

dir. (Universitat Autònoma de Barcelona. Departament de Ciències de la Computació)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Títol variant:	Reinforcement learning en videojocs
Títol variant:	Reinforcement learning en videojuegos
Data:	2024
Resum:	Aquest projecte explora l'aprenentatge reforçat (RL) en videojocs, una tècnica de machine learning que entrena un agent per aprendre a jugar a videojocs pel seu compte. Aquest projecte combina recerca teòrica amb implementacions pràctiques des de mètodes tabulars fins a mètodes basats en aprenentatge profund. Comença amb una introducció als fonaments de RL, aplicant solucions tabulars com Q-learning a l'entorn de Frozen Lake. A continuació, es dedica a resoldre el repte CartPole utilitzant approximate solution methods, i a millorar els resultats implementant una feedforward Deep Q-Network (DQN). El projecte culmina amb el desenvolupament d'una xarxa neuronal convolucional (CNN) DQN per abordar el joc Pong d'Atari. Els resultats emfatitzen l'adaptabilitat i el potencial de RL en videojocs, destacant millores significatives en la consistència d'aprenentatge i el rendiment a través d'arquitectures neuronals avançades.
Resum:	Este proyecto explora el aprendizaje reforzado (RL) en videojuegos, una técnica de machine learning que entrena un agente para aprender a jugar a videojuegos por su cuenta. Este proyecto combina investigación teórica con implementaciones prácticas desde métodos tabulares hasta métodos basados en aprendizaje profundo. Empieza con una introducción a los cimientos de RL, aplicando soluciones tabulares como Q-learning en el entorno de Frozen Lake. A continuación, se dedica a resolver el reto CartPole utilizando approximate solution methods, y a mejorar los resultados implementando una feedforward Deep Q-Network (DQN). El proyecto culmina con el desarrollo de una red neuronal convolucional (CNN) DQN para abordar el juego Pong de Atari. Los resultados enfatizan la adaptabilidad y el potencial de RL en videojuegos, destacando mejoras significativas en la consistencia de aprendizaje y el rendimiento a través de arquitecturas neuronales avanzadas.
Resum:	This project explores reinforcement learning (RL) applications in video games, a machine learning technique that trains an agent to learn how to play video games on its own. Ranging from tabular methods to more advanced deep learning-based approaches, this project combines theoretical research with multiple practical implementations. It begins with an introduction to RL fundamentals, applying tabular solutions like Q-learning to the Frozen Lake environment. Then goes into solving the CartPole challenge using approximate solution methods, and improving those results implementing a feedforward Deep Q-Network (DQN). The project culminates with the development of a convolutional neural network (CNN) DQN to tackle the Atari Pong game. Results emphasize the adaptability and potential of RL in video gaming, highlighting significant improvements in learning consistency and performance through advanced neural architectures.
Drets:	Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades.
Llengua:	Anglès
Titulació:	Grau en Enginyeria Informàtica [2502441]
Pla d'estudis:	Enginyeria Informàtica [958]
Document:	Treball final de grau ; Text
Àrea temàtica:	Menció Computació
Matèria:	Aprenentatge Reforçat ; Mètodes Tabulars ; Programació Dinàmica ; Mètodes Monte Carlo ; Q-learning ; Deep Q-Network ; Convolutional Neural Networks ; Function Approximation ; Aprendizaje Reforzado ; Métodos Tabulares ; Programación Dinámica ; Métodos Monte Carlo ; Reinforcement Learning ; Tabular Methods ; Dynamic Programming ; Monte Carlo Methods

12 p, 871.9 KB

El registre apareix a les col·leccions:
Documents de recerca > Treballs de Fi de Grau > Escola d'Enginyeria. TFG

Registre creat el 2024-07-17, darrera modificació el 2024-07-25

Registres semblants

Afegeix-lo al cistell personal
Anomena i desa Citation, BibTeX, MARC, MARCXML, DC, EDM OpenAire4