Jugador d'un joc de cartes interactiu
Arnaus Comellas, Martí
Vanrell i Martorell, Maria Isabel, dir. (Universitat Autònoma de Barcelona. Departament de Ciències de la Computació)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Títol variant: Interactive player of a card game
Títol variant: Jugador de un juego de cartas interactivo
Data: 2023
Resum: L'objectiu d'aquest projecte és dissenyar i implementar diversos algoritmes d'Intel·ligència Artificial (IA) que siguin capaços de jugar a La Podrida enfront d'un jugador humà o d'altres agents intel·ligents. El sistema s'ha orientat a expandir la llibreria RL Card de Python. A part del disseny del jugador humà i el jugador aleatori, s'ha dissenyat un agent basat en regles heurístiques i un basat en la Cerca de Monte-Carlo (Monte-Carlo Tree Search MCTS). Per avaluar els diferents agents, s'han dissenyat i realitzat un conjunt d'experiments que han fet concloure que el MCTS és el millor algorisme i ens ha permès estudiar diferents alternatives de millores que de moment queden fora de l'abast d'aquest projecte.
Resum: The aim of this project is to design and implement various Artificial Intelligence (AI) algorithms that are capable of playing La Podrida against a human player or other intelligent agents. The system is aimed at expanding the Python RL Card library. Apart from the design of the human player and the random player, an agent based on heuristic rules and one based on Monte-Carlo Tree Search (MCTS) have been designed. To evaluate the different agents, a set of experiments have been designed and carried out that have led to the conclusion that the MCTS is the best algorithm and has allowed us to envisage different alternatives for improvements that are currently outside the scope of this project.
Resum: El objetivo de este proyecto es diseñar e implementar varios algoritmos de Inteligencia Artificial (IA) que sean capaces de jugar en La Podrida frente a un jugador humano o de otros agentes inteligentes. El sistema se ha orientado a expandir la librería RL Card de Python. Aparte del diseño del jugador humano y el jugador aleatorio, se ha diseñado un agente basado en reglas heurísticas y uno basado en la Cerca de Monte-Carlo (Monte-Carlo Tree Search MCTS). Para evaluar a los diferentes agentes, se han diseñado y realizado un conjunto de experimentos que han hecho concluir que el MCTS es el mejor algoritmo y nos ha permitido estudiar diferentes alternativas de mejoras que de momento quedan fuera del alcance de este proyecto.
Drets: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, la comunicació pública de l'obra i la creació d'obres derivades, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. Creative Commons
Llengua: Català
Titulació: Grau en Enginyeria Informàtica [2502441]
Pla d'estudis: Enginyeria Informàtica [958]
Document: Treball final de grau ; Text
Àrea temàtica: Menció Computació
Matèria: Algoritmes IA ; Monte-Carlo Tree Search ; Reinforcement Learning ; RL Card ; Rule-Based ; Xarxa Neuronal ; Algorismos IA ; Red Neuronal ; AI Algorithms ; Neuronal Network



13 p, 1.3 MB

El registre apareix a les col·leccions:
Documents de recerca > Treballs de Fi de Grau > Escola d'Enginyeria. TFG

 Registre creat el 2023-03-07, darrera modificació el 2023-07-22



   Favorit i Compartir