Aplicación de distintos algoritmos de IA y RL para aprender a jugar a Connect4
Sánchez Resina, Iván
Vanrell i Martorell, Maria Isabel, dir. (Universitat Autònoma de Barcelona. Departament de Ciències de la Computació)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Título variante: Application of differents algorithms of AI and RL to learn play Connect4
Título variante: Aplicació de diferents algoritmes d'IA i RL per a aprendre a jugar a Connect4
Fecha: 2020
Resumen: El objetivo de este proyecto es implementar un juego de Connect 4 y añadirle varios algoritmos de IA que sirvan como oponentes a un jugador real y entre ellos mismos. De estos algoritmos implementados realitzar varias pruebas sobre los parámetros que regulan su comportamiento con el objetivo de estudiar cómo interactua cada uno con los otros y cuál es el más eficiente. Los algoritmos implementados son Minimax, Minimax con poda alfabeta, Monte Carlo Tree Search y una implementación parcial del algoritmo de Reinforcement Learning conocido como AlphaZero, el cual aplica el MCTS pero utilizando una red neuronal entrenada para predecir los mejores movimientos.
Resumen: The objective of this project is to implement a Connect 4 game and use different AI algorithms that act as opponents to a real player and among themselves. Of these implemented algorithms, carry out several tests on the parameters that regulate their behavior in order to study how each interacts with the others and which is the most efficient. The algorithms implemented are Minimax, Minimax with alphabetic pruning, Monte Carlo Tree Search and a partial implementation of the Reinforcement Learning algorithm known as AlphaZero, which applies the MCTS but using a trained neural network to predict the best movements.
Resumen: L'objectiu d'aquest projecte és implementar un joc de Connect 4 i afegir diversos algoritmes d'IA que serveixin com a oponents a un jugador real i entre ells mateixos. D'aquests algoritmes implementats realitzar diverses proves sobre els paràmetres que regulen el seu comportament amb l'objectiu d'estudiar com interactua cada un amb els altres i quin és el més eficient. Els algoritmes implementats són Minimax, Minimax amb poda alfabeta, Montecarlo Tree motor i una implementació parcial de l'algoritme de Reinforcement Learning conegut com AlphaZero, el qual s'aplica el MCTS però utilitzant una xarxa neuronal entrenada per predir els millors moviments.
Derechos: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Lengua: Castellà
Titulación: Grau en Enginyeria Informàtica [2502441]
Plan de estudios: Enginyeria Informàtica [958]
Documento: Treball final de grau ; Text
Área temática: Menció Computació
Materia: Algortimos IA ; Teoria de juegos ; Red Neuronal ; Monte Carlo Tree Search ; Minimax ; Minimax AlphaBeta ; Connect4 ; AlphaZero ; IA-driven algorithm ; Game Theory ; Neural Network ; Algorisme basat en IA ; Teoria de jocs ; Xarxa neuronal



10 p, 1.2 MB

El registro aparece en las colecciones:
Documentos de investigación > Trabajos de Fin de Grado > Escuela de Ingeniería. TFG

 Registro creado el 2020-07-06, última modificación el 2023-07-22



   Favorit i Compartir