Propuesta metodológica para el análisis de supervivencia con eventos recurrentes en estudios epidemiológicos cuando el número de eventos previos es desconocido
Hernández Herrera, Gilma Norela
Navarro Giné, Albert, dir.
Moriña, David, dir.

Fecha: 2021
Resumen: Introducció: En molts estudis clínics, epidemiològics i de salut pública, l'esdeveniment d'interès es presenta sovint més d'una vegada i els temps entre ocurrències poden estar correlacionats. Per a aquest tipus de situacions, es requereix comptar amb mètodes estadístics específics que permetin donar resposta a preguntes relacionades amb la probabilitat d'ocurrència de nous esdeveniments i l'impacte de les covariables afegides. Quan hi ha recurrència d'esdeveniments, l'experiència ha mostrat que es pot presentar dependència d'esdeveniment i heterogeneïtat individual que obliguen a pensar en mètodes d'anàlisi més enllà del model de Cox estàndard. En aquest tipus d'anàlisi, la censura a l'esquerra juga un paper determinant, però, la història prèvia sovint és desconeguda i és important establir estratègies per al seu maneig. Objectiu: Proposar una alternativa d'anàlisi de supervivència per a esdeveniments recurrents amb dependència d'esdeveniment quan es desconeix el nombre d'episodis previs a l'inici de l'seguiment per part (o tots) els subjectes de la mostra. Metodologia: Es van dur a terme dues fases. La primera va incloure la revisió de mètodes per al tractament de dades mancants i la identificació d'un mètode adequat per imputar aquestes dades quan la variable és de re-compte, a través d'un estudi de simulació que permetés comparar diferents mètodes basats en la distribució Poisson i generalitzacions d'aquesta distribució; tenint en compte a més diferents escenaris de dispersió i diferents percentatges de dades mancants. La segona fase va incloure la revisió de models disponibles per a l'anàlisi de supervivència quan hi ha esdeveniments recurrents amb dependència d'esdeveniment i heterogeneïtat individual i es va desenvolupar un estudi de simulació que permetés identificar el millor model per ajustar a dades d'esdeveniments recurrents amb aquestes característiques, imputant la informació prèvia (censura a esquerra) amb el mètode trobat a la primera simulació. Resultats: En la primera fase, es va trobar que el model adequat per imputar aquesta variable, quan hi ha sobredispersió, equidispersión, infradispersión o excés de zeros és la imputació múltiple basada en la distribució COMPoisson. En la segona fase, es va trobar que els models PWP-CP i PWP-GT incloent el component de fragilitat, estratificant segons si s'havia estat a risc previ, i imputant els episodis previs mostraba el millor rendiment. Addicional als dos estudis de simulació, es va construir un paquet en R miRecSurv posat a disposició de la comunitat científica per al seu ús. Conclusions Per a la imputació de dades mancants quan es té una variable de re-compte, la decisió de l'mètode es basa en l'anàlisi de dispersió de la variable i en el percentatge de dades perdudes. Segons els resultats de simulació en aquest estudi, el model COMPoisson es comporta bé per a la imputació de variable discreta ja que és flexible pel que fa a l'ús d'aquesta variable amb característiques de sobre i subdispersión, així com amb equidispersión. La proposta de model realitzada en aquesta tesi sembla funcionar raonablement bé per a la majoria de situacions estudiades, en general molt millor que l'alternativa de l'ús de models amb risc basal comú. Si el fenomen d'interès es genera a partir de funcions de risc constants, i quan tots els subjectes de la mostra han estat a risc de l'esdeveniment abans de l'inici de l'seguiment, el model proposat en la seva formulació gap time sembla ser el més adequat. I si el fenomen d'interès es genera a partir de funcions de risc no constants, el model més adequat és el proposat amb formulació counting process, al menys fins al 50% de subjectes a risc previ a l'inici de l'seguiment.
Resumen: Introducción En muchos estudios clínicos, epidemiológicos y de salud pública, el evento de interés se presenta a menudo más de una vez y los tiempos entre ocurrencias pueden estar correlacionados. Para este tipo de datos, se requiere contar con métodos estadísticos específicos que permitan dar respuesta a preguntas relacionadas con la probabilidad de ocurrencia de nuevos eventos y el impacto de las covariables añadidas. Cuando hay recurrencia de eventos, se ha mostrado que se puede presentar dependencia de evento y heterogeneidad individual que conllevan a pensar en métodos de análisis más allá del modelo de Cox estándar. En este tipo de análisis, la censura a la izquierda juega un papel determinante, sin embargo, la historia previa a menudo es desconocida y es importante establecer estrategias para su manejo. Objetivo Proponer una alternativa de análisis de supervivencia para eventos recurrentes con dependencia de evento cuando se desconoce el número de episodios previos al inicio del seguimiento para parte (o todos) los sujetos de la muestra. Metodología Se llevaron a cabo dos fases. La primera incluyó la revisión de métodos para el tratamiento de datos faltantes y la identificación de un método adecuado para imputar estos datos cuando la variable fuese de conteo, a través de un estudio de simulación que permitiera comparar diferentes métodos basados en la distribución Poisson y generalizaciones de esta, teniendo en cuenta diferentes escenarios de dispersión y diferentes porcentajes de datos faltantes. La segunda fase incluyó la revisión de modelos disponibles para el análisis de supervivencia cuando hay eventos recurrentes con dependencia de evento y heterogeneidad individual y se desarrolló estudio de simulación para identificar el mejor modelo de ajuste a datos de eventos recurrentes con estas características, imputando la información previa (censura a izquierda) con el método encontrado. Resultados En la primera fase, se encontró que el modelo adecuado para imputar variable discreta, cuando hay sobredispersión, equidispersión, infradispersión o exceso de ceros es la imputación múltiple usando la distribución COMPoisson. En la segunda fase, se encontró que los modelos PWP-CP y PWP-GT incluyendo el componente de fragilidad, estratificando según si se había estado a riesgo previo e imputando los episodios previos mostraron mejor rendimiento. Para la implementación del modelo propuesto se construyó un paquete en R miRecSurv puesto a disposición de la comunidad científica para su uso. Conclusiones Para la imputación de datos faltantes cuando se tiene una variable de conteo, el modelo COMPoisson se comporta bien ya que es flexible en cuanto al manejo de esta variable con características de sobre y subdispersión, así como con equidispersión. La propuesta de modelo realizada en esta tesis parece funcionar razonablemente bien para la mayoría de situaciones estudiadas, en general, con mejor comportamiento que la alternativa del uso de modelos con riesgo basal común. Si el fenómeno de interés se genera a partir de funciones de riesgo constantes, y cuando todos los sujetos de la muestra han estado a riesgo del evento antes del inicio del seguimiento, el modelo propuesto en su formulación gap time parece ser el más adecuado. Si el fenómeno de interés se genera a partir de funciones de riesgo no constantes, el modelo más adecuado es el propuesto con formulación counting process, al menos hasta el 50 % de sujetos a riesgo previo al inicio del seguimiento.
Resumen: Introduction In many clinical, epidemiological, and public health studies, the event of interest often occurs more than once, and the times between occurrences may be correlated. For this type of data, it is required to have specific statistical methods that allow answering questions that arise in epidemiological investigations related to the probability of occurrence of new events and the impact of the additional covariates. When there is a recurrence of events, experience has shown that event dependence and individual heterogeneity are very common, leading to the need of analysis methods that go beyond the standard Cox model. In this type of analysis, left censorship plays a determining role. However, the previous history is often unknown and it is important to establish strategies for its management. Objective Propose an alternative survival analysis for recurrent events with event dependence when the number of episodes prior to the start of follow-up is unknown for part (or all) of the subjects in the sample. Methodology: To fulfill the main objective of this study, two phases were carried out. The first included the review of methods for the treatment of missing data and the identification of an adequate method to impute these data when the variable was discrete, through a simulation study that allowed the comparison of different methods based on the Poisson distribution and generalizations of this distribution, also taking into account different dispersion scenarios and different percentages of missing data. The second phase included the review of models available for survival analysis when there are recurrent events with event dependence and individual heterogeneity and a simulation study was developed to identify the best model to adjust data from recurrent events with these characteristics, imputing the previous information (left censorship) with the method found in the first phase. Results: In the first phase, it was found that the appropriate model to impute this variable, when there is over-dispersion, equidispersion, under-dispersion or excess of zeros is multiple imputation using the COMPoisson distribution. In the second phase, it was found that the PWP-CP and PWP-GT models including the frailty component, stratifying according to whether they had been at previous risk, and imputing the previous episodes, showed better performance. In addition to the two simulation studies, and taking into account the need for available software for this type of analysis, a package was built in R miRecSurv and made available to the scientific community for its use. Conclusions For the imputation of missing data when dealing with a count variable, the decision of the optimal method is based on the dispersion analysis of the variable and on the percentage of missing data. According to the simulation results in this study, the COMPoisson model behaves well for the imputation of the counting variable since it is flexible in terms of handling variables showing over and sub-dispersion, as well as with equidispersion. The model proposal made in this thesis seems to work reasonably well for most of the situations studied, in general much better than the alternative of using models with common baseline risk. If the phenomenon of interest is generated from constant risk functions, and when all the subjects in the sample have been at risk of the event before the start of the follow-up, the model proposed in its gap time formulation seems to be the more appropriate. And if the phenomenon of interest is generated from non-constant risk functions, the most appropriate model is the one proposed with a counting process formulation, at least up to 50% of subjects at risk prior to the start of follow-up.
Derechos: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Lengua: Castellà
Colección: Programa de Doctorat en Metodologia de la Recerca Biomèdica i Salut Pública
Documento: Tesi doctoral ; Text ; Versió publicada
Materia: Esdeveniments recurrents ; Eventos recurrentes ; Recurrent events ; Dependència d'esdeveniment ; Dependencia de evento ; Dependence event ; Imputació ; Imputación ; Imputation ; Ciències de la Salut

Adreça alternativa: https://hdl.handle.net/10803/671165


168 p, 4.6 MB

El registro aparece en las colecciones:
Documentos de investigación > Tesis doctorales

 Registro creado el 2021-06-02, última modificación el 2022-12-19



   Favorit i Compartir