Patient-centric synthetic data generation : a new methodology for Chronic Kidney Disease
Alvarez, Candelaria 
(Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius)
Ibeas, Jose 
(Parc Taulí Hospital Universitari. Institut d'Investigació i Innovació Parc Taulí (I3PT))
Balladini, Javier 
(Universidad Nacional del Comahue)
Suppi Boldrito, Remo 
(Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius)
| Fecha: |
2024 |
| Descripción: |
10 pàg. |
| Resumen: |
Access to medical data is often restricted due to privacy and security policies. Synthetic data generation from real data is a widely adopted technique to address these limitations. This research presents a patient-centric, methodology for generating synthetic data, specifically designed for patients diagnosed with Chronic Kidney Disease (CKD). The key advantage of this proposal is its explainability and the traceability of the results, as it relies on statistics and data analysis rather than AI algorithms. The MIMIC-III clinical dataset serves as the foundation for generating synthetic patients in this study. This article details the data preprocessing and filtering applied to this dataset. Subsequently, synthetic data for CKD patients is generated using the proposed methodology. A comparison is then conducted between the synthetic data and the real data. Additionally, the synthetic data is compared with results obtained using the AI algorithm known as SMOTE. Generally, the metrics for the synthetic data generated by SMOTE are slightly superior. However, the results obtained with the proposed methodology exhibit minimal deviations from the MIMIC data across most CKD stages. |
| Ayudas: |
Agencia Estatal de Investigación PID2020-112496GB-I00
|
| Derechos: |
Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, la comunicació pública de l'obra, i la creació d'obres derivades, sempre que no sigui amb finalitats comercials i que es distribueixin sota la mateixa llicència que regula l'obra original. Cal que es reconegui l'autoria de l'obra original.  |
| Lengua: |
Anglès |
| Documento: |
Capítol de llibre ; recerca ; Versió publicada |
| Materia: |
Patient-centric ;
Methodology ;
Synthetic ;
Data generation ;
Chronic kidney disease |
| Publicado en: |
Libro de actas: 30º Congreso Argentino de Ciencias de la Computación CACIC 2024, 2024, p. 280-289, ISBN 978-950-34-2428-5 |
Adreça alternativa: https://sedici.unlp.edu.ar/handle/10915/172755
El registro aparece en las colecciones:
Libros y colecciones >
Capítulos de libros
Registro creado el 2025-01-18, última modificación el 2025-03-08