Inferencia para datos funcionales : estudio sobre la contaminación del aire en Barcelona
Hernández Rabell, María
Cabaña Nigro, Alejandra, dir. (Universitat Autònoma de Barcelona. Departament de Matemàtiques)
Universitat Autònoma de Barcelona. Facultat de Ciències

Date: 2016
Description: 21 pag.
Abstract: En este estudio introducimos el problema de comparación de dos muestras para datos funcionales, usando datos de niveles de dióxido de nitrógeno en diferentes puntos de la ciudad de Barcelona durante los años 2014 y 2015. Contexto: La contaminación en las grandes ciudades es un grave problema. Analizar de manera adecuada los niveles de contaminación para poder detectar la necesidad de activación de protocolos, como ha pasado en Madrid, es muy importante. Objectivos: A partir de datos de alta frecuencia tratados como datos funcionales ver si las medias de dos muestras son diferentes según tipos de días, zonas de Barcelona y años. Métodos: Comparación de dos medias con datos funcionales, usando un estadístico de contraste basado en proyecciones en el espacio de las primeras componentes principales del operador de covarianzas. Resultados: Claras diferencias entre los días laborables y festivos (más contaminación en los laborables), también diferencias entre los niveles de NO2 de 2014 y 2015; diferencias entre todas las zonas, excepto entre Sants i Palau Reial en días festivos. Además, l'Eixample es la zona más contaminada. Conclusiones: En este estudio se ha intentado dar una visión general sobre los datos funcionales y una solución al problema de comparación de dos muestras con este tipo de datos. Para ello se han implementado funciones en R que han permitido afirmar los resultados anteriores, y éstos son bastante coherentes debido a que los niveles más altos de NO2 corresponden a las horas de más tráfico y no hay resultados especialmente sorprendentes.
Abstract: In this research we introduce the problem about comparing two samples for functional data, using as data example the levels of nitrogen dioxide in diferents points of Barcelona between years 2014 and 2015. Context: The pollution in big cities is a major problem. A properly analisis pollution levels to detect the need for protocols activation, as happened in Madrid, is very important. Objectives: Use high frequency data treated as functional data to contrast if the means of two sample are different according to types of days, areas of Barcelona and years. Methods: Comparison of two means with functional data, using a contrast statistic based on projections in the space of the d first principal components of the covariance operator. Results: Clear differences between working days and non working days (most pollution in working), also differences between the levels of NO2 in 2014 and 2015; dierences between all areas except between Sants i Palau Reial at non working days. As more to say, l'Eixample is the most contaminated area. Conclusions: This study has tried to give an overview to functional data and a way to solve the problem of comparing two samples with this type of data. For this we have implemented functions in R that empower we to claim the results previously commented, we trust R results because the highest levels of NO2 correspond to rush hour of the working days, which leads us to say that there isn't specially surprising results.
Abstract: En aquest estudi introduirem el problema de comparació de dues mostres per a dades funcionals, utilitzant dades de nivells de diòxid de nitrogen en diferents punts de la ciutat de Barcelona durant els anys 2014 i 2015. Context: La contaminació a les grans ciutats és un greu problema. Analitzar de manera adequada els nivells de contaminació per poder detectar la necessitat d'activació de protocols, com ha passat a Madrid, és molt important. Objectius: A partir de dades d'alta freqüència tractades com a dades funcionals veure si les mitjanes de dues mostres són diferents segons els tipus de dies, zones de Barcelona i anys. Mètodes: Comparació de dues mitjanes amb dades funcionals, utilitzant un estadístic de contrast basat en les projeccions a l'espai de les d primeres components principals de l'operador de covariàncies. Resultats: Clares diferències entre els dies laborables i festius (més contaminació als laborables), també diferencies entre els nivells de NO2 de 2014 i 2015; diferencies entre totes les zones, excepte entre Sants i Palau Reial en dies festius. A més, l'Eixample és la zona més contaminada. Conclusions: En aquest estudi s'ha intentatdonar una visió general sobre les dades funcionals i una solució al problema de comparació de dues mostres amb aquest tipus de dades. Per a això s'han implementat funcions en R que han permès afirmar els resultats anteriors, i aquests són bastant coherents ja que els nivells més alts de NO2 corresponen a les hores de més tràfic i no hi han resultats especialment sorprenents.
Rights: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la comunicació pública de l'obra i la creació d'obres derivades, sempre que no sigui amb finalitats comercials i que es distribueixin sota la mateixa llicència que regula l'obra original. Cal que es reconegui l'autoria de l'obra original. Creative Commons
Language: Castellà
Studies: Estadística Aplicada [2501919]
Study plan: Grau en Estadística Aplicada [973]
Document: Treball final de grau ; Text
Subject: Análisis de datos funcionales (FDA) ; Comparación de medias ; Dos muestras ; Análisis de componentes principales (PCA) ; Dióxido de nitrógeno (NO2) ; Functional data analysis (FDA) ; Comparison of means ; Two samples ; Principal component ; Analysis (PCA) ; Nitrogen dioxide (NO2) ; Anàlisi de dades funcionals (FDA) ; Comparació de mitjanes ; Dues mostres ; Anàlisi de components principals (PCA) ; Diòxid de nitrogen (NO2)



27 p, 976.0 KB

The record appears in these collections:
Research literature > Bachelor's degree final project > Sciences Faculty

 Record created 2018-06-08, last modified 2022-05-01



   Favorit i Compartir