Theory and Algorithms on the Median Graph. Application to Graph-based Classification and Clustering

Theory and Algorithms on the Median Graph. Application to Graph-based Classification and Clustering

Veure els fitxers associats amb aquesta Tesi

AutorFerrer Sumsi, Miquel
Adreça de correu electrònic miqui.ferrer@gmail.com
URLhttp://www.tdx.cat/TDX-0212109-100250
TítolTheory and Algorithms on the Median Graph. Application to Graph-based Classification and Clustering
Llengua Anglès
UniversitatUAB
Departament/Institut471 - DEPARTAMENT DE CIÈNCIES DE LA COMPUTACIÓ
Àrea de coneixement Tecnologies
Matèries
  • 519.1 - Teoria general de l'anàlisi combinatòria. Teoria de grafs
  • Dipòsit legal/ISBN B-44129-2008 / 978-84-691-6563-8
    Direcció de la tesi
  • Valveny Llobet, Ernest. Director/a de la Tesi
  • Serratosa Casanelles, Francesc. Codirector/a de la Tesi
  • Paraules clau
  • Median Graph
  • Graph Matching
  • Structural Pattern Recognition
  • Data de defensa6-06-2008

    Resum

    Donat un conjunt d'objectes, el concepte genèric de mediana està denit com l'objecte amb la suma de distàncies a tot el conjunt, més petita. Sovint, aquest concepte és usat per a obtenir el representant del conjunt.

    En el reconeixement estructural de patrons, els grafs han estat usats normalment per a representar objectes complexos. En el domini dels grafs, el concepte de mediana és conegut com median graph. Potencialment, té les mateixes aplicacions que el concepte de mediana per poder ser usat com a representant d'un conjunt de grafs.

    Tot i la seva simple denició i les potencials aplicacions, s'ha demostrat que el seu càlcul és una tasca extremadament complexa. Tots els algorismes existents només han estat capaços de treballar amb conjunts petits de grafs, i per tant, la seva aplicació ha estat limitada en molts casos a usar dades sintètiques sense signicat real. Així, tot i el seu potencial, ha restat com un concepte eminentment teòric.

    L'objectiu principal d'aquesta tesi doctoral és el d'investigar a fons la teoria i l'algorísmica relacionada amb el concepte de medinan graph, amb l'objectiu nal d'extendre la seva aplicabilitat i lliurar tot el seu potencial al món de les aplicacions reals. Per això, presentem nous resultats teòrics i també nous algorismes per al seu càlcul. Des d'un punt de vista teòric aquesta tesi fa dues aportacions fonamentals. Per una banda, s'introdueix el nou concepte d'spectral median graph. Per altra banda es mostra que certes de les propietats teòriques del median graph poden ser millorades sota determinades condicions. Més enllà de les aportacioncs teòriques, proposem cinc noves alternatives per al seu càlcul. La primera d'elles és una conseqüència directa del concepte d'spectral median graph. Després, basats en les millores de les propietats teòriques, presentem dues alternatives més per a la seva obtenció. Finalment, s'introdueix una nova tècnica per al càlcul del median basat en el mapeig de grafs en espais de vectors, i es proposen dos nous algorismes més.

    L'avaluació experimental dels mètodes proposats utilitzant una base de dades semi-articial (símbols gràcs) i dues amb dades reals (mollècules i pàgines web), mostra que aquests mètodes són molt més ecients que els existents. A més, per primera vegada, hem demostrat que el median graph pot ser un bon representant d'un conjunt d'objectes utilitzant grans quantitats de dades. Hem dut a terme experiments de classicació i clustering que validen aquesta hipòtesi i permeten preveure una pròspera aplicació del median graph a un bon nombre d'algorismes d'aprenentatge.

    ---------------------------------------------------------------

    Given a set of objects, the generic concept of median is dened as the object with the smallest sum of distances to all the objects in the set. It has been often used as a good alternative to obtain a representative of the set.

    In structural pattern recognition, graphs are normally used to represent structured objects. In the graph domain, the concept analogous to the median is known as the median graph. By extension, it has the same potential applications as the generic median in order to be used as the representative of a set of graphs.

    Despite its simple denition and potential applications, its computation has been shown as an extremely complex task. All the existing algorithms can only deal with small sets of graphs, and its application has been constrained in most cases to the use of synthetic data with no real meaning. Thus, it has mainly remained in the box of the theoretical concepts.

    The main objective of this work is to further investigate both the theory and the algorithmic underlying the concept of the median graph with the nal objective to extend its applicability and bring all its potential to the world of real applications. To this end, new theory and new algorithms for its computation are reported. From a theoretical point of view, this thesis makes two main contributions. On one hand, the new concept of spectral median graph. On the other hand, we show that some of the existing theoretical properties of the median graph can be improved under some specic conditions. In addition to these theoretical contributions, we propose ve new ways to compute the median graph. One of them is a direct consequence of the spectral median graph concept. In addition, we provide two new algorithms based on the new theoretical properties. Finally, we present a novel technique for the median graph computation based on graph embedding into vector spaces. With this technique two more new algorithms are presented.

    The experimental evaluation of the proposed methods on one semi-articial and two real-world datasets, representing graphical symbols, molecules and webpages, shows that these methods are much more ecient than the existing ones. In addition, we have been able to proof for the rst time that the median graph can be a good representative of a class in large datasets. We have performed some classication and clustering experiments that validate this hypothesis and permit to foresee a successful application of the median graph to a variety of machine learning algorithms.

    Documents ADVERTIMENT. La consulta d'aquesta tesi queda condicionada a l'acceptació de les següents condicions d'ús.

    La difusió d'aquesta tesi per mitjà del servei TDX ha estat autoritzada pels titulars dels drets de propietat intel.lectual únicament per a usos privats emmarcats en activitats d'investigació i docència. No s'autoritza la seva reproducció amb finalitats de lucre ni la seva difusió i posada a disposició des d'un lloc aliè al servei TDX. No s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing).

    Aquesta reserva de drets afecta tant al resum de presentació de la tesi com als seus continguts. En la utilització o cita de parts de la tesi és obligat indicar el nom de la persona autora.

  • mfs1de1.pdf
  • NOVA CERCA
    Organization:UAB Author:Ferrer,Sumsi,Miquel URN:http://www.tdx.cat/TDX-0212109-100250 Title:Theory and Algorithms on the Median Graph. Application to Graph-based Classification and Clustering Department:471 - DEPARTAMENT DE CIÈNCIES DE LA COMPUTACIÓ Subject:CDU519.1 Advisor:Valveny Llobet, Ernest. Director/a de la Tesi Advisor:Serratosa Casanelles, Francesc. Codirector/a de la Tesi Keywords:Median Graph Keywords:Graph Matching Keywords:Structural Pattern Recognition DefenseDate:6-06-2008