Analysis of aberrant response patterns in educational multiple choice tests
Morató Catafal, Alba
Doval Dieguez, Eduardo, dir.
Universitat Autònoma de Barcelona. Facultat de Psicologia

Fecha: 2018
Descripción: 51 pag.
Resumen: The objective of this project has consisted on providing empirical evidence of the validity of individual scores in an evaluation test by performing an aberrant pattern analysis of the results of the PIR exam of 2005. The tool used has been person-fit analysis, which allows to detect anomal patterns in the individual responses to the test that might imply a bias in the score of a test to infer a trait level. The personfit indices computed have been Ht, C* and lz (with their respective cutoff values). These indices have been computed for nine sub-datasets into which the data has been splitted, in order to accomplish one of the assumptions of the models. For the same reason, some of its items have had to be erased and an IRT model (1, 2 or 3 parameters) has had to be chosen for each of the sub-datasets. After that, the individuals who had obtained the best marks in the test have been analysed. For that, their responses to certain of the sub-datasets that had been flagged as aberrant have been compared to simulated data in order to visually identify the type of aberrant patern commited by them. It has been found that the majority of them could actually be classified as normal, some may have been lucky guessers and a few present cheating patterns. However, this information is not a firm conclusion but consists on indicators that should be complemented by further information such as interviews.
Resumen: El objetivo de este proyecto ha sido proporcionar evidencia empírica de la validez de las puntuaciones individuales del examen PIR de 2005 mediante un análisis de patrones atípicos de respuesta de sus resultados. La herramienta usada ha sido el análisis person-fit, que permite detectar patrones atípicos en las respuestas de los individuos al test, lo cuál puede implicar un sesgo en la puntuación obtenida en esta, de la cual se infiera un nivel de rasgo, en el caso del PIR conocimientos en psicología. Los índices calculados han sido el Ht, el C* y el lz (con sus respectivos puntos de corte). Estos índices han sido calculados para nueve sub bases de datos en las que se ha dividido la base de datos inicial, para cumplir con una de las asunciones del modelo. Por la misma razón, algunos de los items han tenido que ser eliminados y un modelo de IRT (1, 2 o 3 parámetros) ha sido elegido para cada una de las sub bases de datos. Después de esto, los individuos que habían obtenido las mejores notas en el examen han sido analizados. Para eso, sus respuestas a algunas de las areas del test que habían estado marcado como atípicas han sido comparadas con datos simulados para así idenficar de manera visual el tipo de patrón atípico de respuesta cometido en cada caso. Así, se encontró que la mayoría de estos podía ser en realidad clasificado como normal, algunos parecían haber tratado de adivinar las respuestas y finalmente, unos pocos parecían mostrar indicios de haber copiado. De todas formas, esta información no constituye una conclusión firme, sin'o que se trata de indicadores que deberían ser contrastados y complementados con más información, como entrevistas.
Resumen: L'objectiu d'aquest projecte ha estat proporcionar evidència empírica de la validesa de les puntuacions individuals de l'examen PIR de 2005 mitjançant un anàlisi de patrons atípics de resposta dels seus resultats. L'eina emprada ha estat l'anàlisi person-fit, que permet detectar patrons atípics de resposta dels individus al test, el qual pot implicar un biaix en la puntuació obtinguda en aquest, de la qual s'infereix un nivell de tret, en el cas del PIR de coneixements en psicologia. Els índexs calculats han estat el Ht, el C* i el lz (amb els seus respectius punts de tall). Aquests índexs han estat calculats per a nou sub bases de dades en les que s'ha dividit la base de dades inicial, per tal de complir amb les assumpcions del model. Per la mateixa raó alguns dels ítems han hagut de ser eliminats i un model d'IRT (1, 2 o 3 paràmetres) ha estat ajustat per a cadascuna de les sub bases de dades. Després d'això, els individus que havien obtingut les millors notes a l'examen han estat analitzats. Per això les seves respostes en algunes de les àrees del test que havíen estat marcades com a atípiques han estat comparades amb dades simulades per a així identificar de manera visual el tipus de patró atípic de resposta comés en cada cas. Així, s'ha trobat que la majoría d'aquests podía ser en realitat classificat com a normal, alguns semblava haver tractar d'endevinar les respostes i finalment, molt pocs, semblaven presentar indicis d'haver copiat. De totes maneres cal tenir en compte que la informació obtinguda no constitueix una conclusió ferma sinó que es tracta d'indicadors, que hauríen de ser contrastats i complementats amb més informació com entrevistes amb els estudiants.
Derechos: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, i la comunicació pública de l'obra, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original. No es permet la creació d'obres derivades. Creative Commons
Lengua: Anglès
Titulación: Psicologia [2502443]
Plan de estudios: Grau en Psicologia [954]
Documento: Treball final de grau ; Text
Materia: Psychometrics ; Person-fit ; IRT ; Psicometria ; TRI



51 p, 2.9 MB

El registro aparece en las colecciones:
Documentos de investigación > Trabajos de Fin de Grado > Facultad de Psicología. TFG

 Registro creado el 2018-12-10, última modificación el 2022-11-04



   Favorit i Compartir