Models per a dades de recompte amb mesures repetides i errors de mesura
Badiella Busquets, Llorenç
Puig Casado, Pedro, dir.

Fecha: 2023
Resumen: La distribució de Poisson, representa un punt de referència per a modelar dades de recompte, ja sigui en el cas d'observacions independents, amb mesures repetides o en presència de factors aleatoris. Però a la pràctica, en l'anàlisi d'aquest tipus de dades en dissenys experimentals més o menys complexos apareixen limitacions. Per un costat, la distribució presenta la restricció que les dades ajustades han de ser equidisperses, fet poc habitual i que requereix contemplar distribucions més complexes. Per altra part, la naturalesa de les eines de modelització provoca dificultats per a comparar propostes alternatives, per a quantificar la bondat de l'ajust o per a validar les suposicions del model. L'objectiu general d'aquesta tesi doctoral és el de descriure les estratègies principals per a l'anàlisi de dades de recompte amb mesures repetides, incidint en les seves limitacions pràctiques i complementàriament, introduir noves propostes alternatives. En primer lloc es revisen les principals tècniques de modelització que s'utilitzen a la pràctica estadística: models lineals, models lineals generalitzats, models mixtos i models lineals generalitzats mixtos, fent èmfasi especial per al cas de dades de recompte. S'exposa la corresponent formulació, les situacions que permeten analitzar i detalls per al seu ajust, validació i aplicació de tasques inferencials. En relació als models lineals mixtos i als models lineals generalitzats mixtos es fa èmfasi en dues visions de modelització contraposades: el model condicional i el model marginal que donen lloc a certa controvèrsia. En aquest sentit es presenten diferents casos pràctics per exemplificar aquestes estratègies de modelització i les seves limitacions, l'estudi del recompte de sinistres en diferents cruïlles de la ciutat de Barcelona sota certa intervenció preventiva mitjançant models lineals generalitzats mixtos condicionals i l'anàlisi de l'impacte de les targetes vermelles en el nombre de gols marcats en diferents partits de futbol emprant models lineals generalitzats marginals. Finalment, es presenten estratègies alternatives per a la modelització de dades de recompte en experiments amb sub-rèpliques mitjançant estadístics d'ordre de distribucions discretes.
Resumen: La distribución de Poisson representa un punto de referencia para modelar datos de recuento, ya sea en el caso de observaciones independientes, con medidas repetidas o en presencia de factores aleatorios. Pero en la práctica, al analizar este tipo de datos en diseños experimentales más o menos complejos aparecen limitaciones. Por un lado, la distribución presenta la restricción de que los datos ajustados deben ser equidispersos, algo poco habitual y que requiere contemplar distribuciones más complejas. Por otra parte, la naturaleza de las herramientas de modelización provoca dificultades para comparar propuestas alternativas, cuantificar la bondad del ajuste o validar las suposiciones del modelo. El objetivo general de esta tesis doctoral es el de describir las principales estrategias para el análisis de datos de recuento con medidas repetidas, incidiendo en sus limitaciones prácticas y, complementariamente, introducir nuevas propuestas alternativas. En primer lugar se revisan las principales técnicas de modelización que se utilizan en la práctica estadística: modelos lineales, modelos lineales generalizados, modelos mixtos y modelos lineales generalizados mixtos, haciendo especial énfasis en el caso de datos de recuento. Se expone la correspondiente formulación, las situaciones que permiten analizar y detalles para su ajuste, validación y aplicación de tareas inferenciales. En relación a los modelos lineales mixtos y a los modelos lineales generalizados mixtos se pone énfasis en dos visiones de modelización contrapuestas: el modelo condicional y el modelo marginal que dan lugar a cierta controversia. En este sentido se presentan diferentes casos prácticos para ejemplificar estas estrategias de modelización y sus limitaciones, el estudio del recuento de siniestros en diferentes cruces de la ciudad de Barcelona bajo cierta intervención preventiva, mediante modelos lineales generalizados mixtos condicionales y el análisis del impacto de las tarjetas rojas en el número de goles marcados en diferentes partidos de fútbol utilizando modelos lineales generalizados marginales. Por último, se presentan estrategias alternativas para la modelización de datos de recuento en experimentos con sub-réplicas mediante estadísticos de orden de distribuciones discretas.
Resumen: The Poisson distribution represents a reference point for modeling count data, either in the case of independent observations, with repeated measurements or in the presence of random factors. But in practice, limitations appear in the analysis of this type of data in complex experimental designs. On the one hand, the distribution has the restriction that the adjusted data must be equidispersed, which is not common and requires the consideration of more complex distributions. On the other hand, it is challenging to compare alternative proposals, quantify the goodness of fit, or validate the model assumptions, due to the nature of the modeling tools. The general objective of this doctoral thesis is to describe the main strategies for the analysis of count data with repeated measures, focusing on their practical limitations, and in addition, to introduce new complementary proposals. First, the main modeling techniques used in statistical practice are reviewed: linear models, generalized linear models, mixed models, and generalized linear mixed models, with special emphasis on the case of count data. The corresponding formulation is presented along with details on the fitting procedures, validation, and inferential tasks. In relation to mixed linear models and generalized linear mixed models, two opposing views of modeling are emphasized: the conditional model and the marginal model, which give rise to some controversy. In this sense, different practical cases are presented to exemplify these modeling strategies and their limitations: the study of car accidents at different intersections in the city of Barcelona under certain preventive intervention, by means of conditional generalized linear mixed models and the analysis of the impact of red cards on the number of goals scored in different soccer matches using marginal generalized linear mixed models. Finally, alternative strategies for modeling count data in experiments with sub-replicates using order statistics from discrete distributions are presented.
Nota: Universitat Autònoma de Barcelona. Programa de Doctorat en Matemàtiques
Derechos: L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: Creative Commons
Lengua: Català
Colección: Programa de Doctorat en Matemàtiques
Documento: Tesi doctoral ; Text ; Versió publicada
Materia: Models lineals generalitzats ; Generalized linear models ; Modelos lineales generalizados ; Ciències Experimentals

Adreça alternativa: https://hdl.handle.net/10803/691053


None, 64.6 KB

El registro aparece en las colecciones:
Documentos de investigación > Tesis doctorales

 Registro creado el 2024-05-30, última modificación el 2024-06-04



   Favorit i Compartir