Generació de dades sintètiques i predicció de dades en entorns reals
Garriga Riba, Arnau
Martí Godia, Enric, dir. (Universitat Autònoma de Barcelona. Departament de Ciències de la Computació)
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Additional title: Generación de datos sintéticos y predicción de datos en entornos reales
Additional title: Synthetic data generation and prediction of data in real environments
Date: 2023
Abstract: Cada cop s'utilitzen més les dades no reals (dades sintètiques) per a millorar els datasets que s'utilitzen en algorismes de Machine Learning. En aquest treball, s'exploren i s'implementen diferents mètodes o algorismes de dades sintètiques sobre tres datasets basant-se en els patrons dels datasets per acabar triant, per a cada dataset, el mètode que generi dades sintètiques més semblants a les dades originals. Posteriorement, s'utilitzen algorismes de Machine Learning per a determinar la millora que ha proporcionat la inclusió d'aquestes dades sintètiques en el dataset original. També es realitzen un seguit de visualitzacions i gràfiques amb les quals es pot comparar de manera visual les dades sintètiques generades amb les dades originals.
Abstract: Cada vez se utilizan más los datos no reales (datos sintéticos) para mejorar los datasets que se utilizan en algoritmos de Machine Learning. En este trabajo, se exploran y se implementan diferentes métodos o algoritmos de datos sintéticos sobre tres datasets basándose en sus patrones para elegir, para cada dataset, el método que genere datos sintéticos más parecidos a los datos originales. Posteriormente, se utilizan algoritmos de Machine Learning para determinar la mejora que ha proporcionado la inclusión de estos datos sintéticos en el dataset original. También se realizan una serie de visualizaciones y gráficas con las que se puede comparar de forma visual los datos sintéticos generados con los datos originales.
Abstract: Non-real data (synthetic data) is increasingly being used to improve the datasets used in Machine Learning algorithms. In this project, different synthetic data methods or algorithms are explored and implemented on three datasets, based on the patterns of the datasets to end up choosing, for each dataset, the method that generates synthetic data most similar to the original data. Later, Machine Learning algorithms are used to determine the improvement provided by the inclusion of this synthetic data in the original dataset. A series of visualizations and graphs are also made with which the synthetic data generated can be compared visually with the original data.
Rights: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Language: Català
Studies: Enginyeria de Dades [2503758]
Study plan: Grau en Enginyeria de Dades [1394]
Document: Treball final de grau ; Text
Subject: Dades sintètiques ; Aprenentatge automàtic ; Imblearn ; Pandas ; Sklearn ; Visualització de Dades ; Python ; Xarxes Neuronals ; Patrons ; Prediccions ; Datos sintéticos ; Aprendizaje automñatico ; Visualitzación de Datos ; Redes Neuronales ; Patrones ; Predicciones ; Syntehtic Data ; Machine Learning ; Data Visualization ; Neural Networks ; Patterns ; Predictions



11 p, 648.6 KB

The record appears in these collections:
Research literature > Bachelor's degree final project > School of Engineering. TFG

 Record created 2023-07-28, last modified 2024-07-20



   Favorit i Compartir