Snake: Implementació d'agents Intel·ligents
Perez Diaz, Cristian
Vanrell i Martorell, Maria Isabel, dir. (Universitat Autònoma de Barcelona. Departament de Ciències de la Computació)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Título variante: Snake : Implementación de agentes inteligentes
Título variante: Snake : Implementation of Intelligent Agents
Fecha: 2023
Resumen: Aquest article presenta un estudi sobre la implementació del joc Snake utilitzant Pygame. S'han implementat i avaluat dos agents basats en heurístiques: Greedy Best-First Search (GBFS) i A*. També s'ha investigat l'aprenentatge per reforç (RL) amb l'algoritme Proximal Policy Optimization (PPO) de Stable Baselines 3. Els agents s'han avaluat segons el seu rendiment en la puntuació.
Resumen: Este artículo presenta un estudio sobre la implementación del juego Snake utilizando Pygame. Se han implementado y evaluado dos agentes basados en heurísticas: Greedy Best-First Search (GBFS) y A*. También se ha investigado el aprendizaje por refuerzo (RL) con el algoritmo Proximal Policy Optimization (PPO) de Stable Baselines 3. Los agentes se han evaluado según su rendimiento en la puntuación.
Resumen: This article presents a study on the implementation of the Snake game using Pygame. Two heuristic-based agents, Greedy Best-First Search (GBFS) and A*, have been implemented and evaluated. The study also investigates reinforcement learning (RL) with the Proximal Policy Optimization (PPO) algorithm from Stable Baselines 3. The agents have been evaluated based on their performance in scoring.
Derechos: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Lengua: Català
Titulación: Grau en Enginyeria Informàtica [2502441]
Plan de estudios: Enginyeria Informàtica [958]
Documento: Treball final de grau ; Text
Área temática: Menció Enginyeria del Software
Materia: Algorismes d'IA ; Aprenentatge per reforçament ; OpenAI ; Gymnasium ; Greedy Best-First Search ; A* ; Pygame ; Joc snake ; Stable Baselines 3 ; Algoritmos de IA ; Aprendizaje por refuerzo ; Juego de la serpiente ; AI algorithms ; Reinforcement learning ; Snake game



10 p, 403.5 KB

El registro aparece en las colecciones:
Documentos de investigación > Trabajos de Fin de Grado > Escuela de Ingeniería. TFG

 Registro creado el 2023-07-18, última modificación el 2023-09-12



   Favorit i Compartir