Contributions to Record Linkage for Disclosure Risk Assessment

Contributions to Record Linkage for Disclosure Risk Assessment

Veure els fitxers associats amb aquesta Tesi

AutorNin Guerrero, Jordi
Adreça de correu electrònic jnin@iiia.csic.es
URLhttp://www.tdx.cat/TDX-1120108-155416
TítolContributions to Record Linkage for Disclosure Risk Assessment
Llengua Anglès
UniversitatUAB
Departament/Institut471 - DEPARTAMENT DE CIÈNCIES DE LA COMPUTACIÓ
Àrea de coneixement Ciències Experimentals
Matèries
  • 68 - Indústries, oficis i comerç d'articles acabats. Tecnologia cibernètica i automàtica
  • Dipòsit legal/ISBN B-44156-2008 / 978-84-691-6595-9
    Direcció de la tesi
  • Torra i Reventós, Vicenç. Director/a de la Tesi
  • Paraules clau
  • Privacy
  • Record linkage
  • Privadesa
  • Data de defensa16-06-2008

    Resum

    Cada dia una gran quantitat de dades són recollides pels instituts d'estadística. Aquest fet combinat amb el creixement que ha experimentat Internet en els darrers anys fa que hom es pregunti si les seves dades confidencials són emmagatzemades i distribuïdes d'una manera privada i segura.

    En aquest marc, els mètodes de protecció de dades tenen una gran importància, convertint-se en crucial anonimitzar les dades abans de la seva publicació. Quan anonimitzem un conjunt de dades amb un mètode de protectió, s'ha d'avaluar el grau de privadesa de les noves dades protegides. Les tècniques de re-identificació, com l'enllaç de registres, són unes de les tècniques més utilitzades per avaluar la seguretat d'un mètode de protecció.

    Aquesta tesi aplica mètodes d'enllaç de registres al càlcul del risc de revelació dels diferents mètodes de protecció de dades. L'objectiu d'aquest procés és avaluar la seguretat d'un mètode de protecció d'una forma pràctica i real. Les principals contribucions d'aquesta tesis són:

    La definició de tres mètodes d'enllaç de registres dissenyats per avaluar el risc de revelació de dos dels mètodes d'anonimització més utilitzats: la microagregació i l'intercanvi de rangs.

    La formalització d'una mesura empírica que avalua el risc de revelació de la microagregació multi variable.

    El desenvolupament de noves variants dels mètodes de protecció clàssics que són resistents a les tècniques d'enllaç de registres definides dins d'aquesta tesi.

    L'estudi de nous escenaris on el risc de revelació encara existeix. Concretament, hem definit un mètode de re-identificació basat en funcions d'agregació que permet re-identificar individus quan l'intrús no té accés a les dades originals abans d'ésser protegides. També hem desenvolupat un marc per a l'avaluació de mètodes de protecció quan aquests s'apliquen a series temporals. En aquest darrer escenari hem definit una serie de mesures per avaluar la pèrdua d'informació i el risc de revelació.

    ---------------------------------------------------------------

    Every day, a large amount of data is collected by statistical agencies. This fact combined with the growth that the Internet has experimented during the recent years makes one wonders whether its confidential data is stored and distributed in a secure way.

    In this framework, data protection methods have a great importance, becoming crucial to anonymize confidential attributes before releasing them in a private and secure manner. When a protection method is applied, a new and challenging problem arises. This problem is the evaluation of the privacy provided by such method. Re-identification techniques, as record linkage methods, are one of the most common techniques for evaluating the security of a protection method.

    This thesis applies record linkage techniques to the calculation of the disclosure risk of a protection method. The aim of this application is to evaluate the security of a protection method in a real and fair way. The main contributions are:

    The definition of three specific record linkage techniques for evaluating two of the most common protection methods: rank swapping and microaggregation.

    The definition of an empirical disclosure risk measure for microaggregation.

    The development of new variants of rank swapping and microaggregation resistant to record linkage methods and disclosure risk measures defined in this thesis.

    The study of new disclosure risk scenarios. In particular, we have developed a record linkage method which applies aggregation functions to re-identify individuals when the intruder has no access to any of the original attributes of the protected data. We have also developed a framework for the evaluation of protection methods when they are applied to time series data.

    Documents ADVERTIMENT. La consulta d'aquesta tesi queda condicionada a l'acceptació de les següents condicions d'ús.

    La difusió d'aquesta tesi per mitjà del servei TDX ha estat autoritzada pels titulars dels drets de propietat intel.lectual únicament per a usos privats emmarcats en activitats d'investigació i docència. No s'autoritza la seva reproducció amb finalitats de lucre ni la seva difusió i posada a disposició des d'un lloc aliè al servei TDX. No s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing).

    Aquesta reserva de drets afecta tant al resum de presentació de la tesi com als seus continguts. En la utilització o cita de parts de la tesi és obligat indicar el nom de la persona autora.

  • jng1de1.pdf
  • NOVA CERCA
    Organization:UAB Author:Nin,Guerrero,Jordi URN:http://www.tdx.cat/TDX-1120108-155416 Title:Contributions to Record Linkage for Disclosure Risk Assessment Department:471 - DEPARTAMENT DE CIÈNCIES DE LA COMPUTACIÓ Subject:CDU68 Advisor:Torra i Reventós, Vicenç. Director/a de la Tesi Keywords:Privacy Keywords:Record linkage Keywords:Privadesa DefenseDate:16-06-2008