ISSN: 1139-8736
Depósito Legal: B-25223-99

3.3.3. Novell ConceptNet

     En los últimos tres años se han comenzado a desarrollar nuevas bases de conocimiento léxico para aplicaciones de la Industria de la Lengua. Una de ella es el ConceptNet, desarrollado por Novell Linguistic Technology Department. Esta red semántica se desarrolló a partir de WordNet 1.5 y acoge el concepto de synset y parte de la estructura, tipos de relaciones y datos. También existen diferencias entre ambos, como por ejemplo el carácter multilingüe, los tipos de objetos de significado o las relaciones semánticas.

    En cuanto a la arquitectura, el ConceptNet contiene todas las especificaciones de WordNet 1.5, más una serie de elementos propios estructurales básicos. Por ejemplo, relaciones (palabra-relacionada y meronimia lugar-área), tipos de datos (Domains o área de conocimiento e Instances o elementos referenciales) y elementos de su arquitectura (dos tipos diferentes de jerarquías o división de sublenguajes y transferencia de significados en distintas lenguas). Algunos elementos de WordNet 1.5 han sido cambiados (como el establecimiento de distintos grados de sinonimia).

    Este sistema, el ConceptNet, está pensado para mantener de una forma sencilla las complejas redes semánticas multilingües, tanto con nuevos significados, como con nuevas palabras o relaciones. Además permite almacenar significados por el usuario sin que éste sea experto en cuestiones semánticas.

    El ConceptNet Database ha sido diseñado y programado para manejar específicamente redes semánticas. Posee un enfoque distinto en cuanto a la programación de bases de datos de conocimiento léxico. Utiliza una base de datos sin comprimir en la que podemos modificar y añadir información. Esta base de datos se comprime para ser integrada en el producto final.

    La base de datos comprimida funciona con motores de acceso rápidos a través de funciones claras y sencillas. También está conectada a otros módulos, como un analizador y generador morfológico, lo que proporciona la posibilidad de tratar el léxico de forma paradigmática desde muchos puntos de vista.

    En cuanto a los datos, aunque WorNet 1.5 fue utilizado como punto de partida, existen numerosas modificaciones y ampliaciones (palabras, significados y relaciones) con respecto al inglés y, por supuesto, con respecto a las otras dos lenguas iniciales de expansión (alemán y francés), así como algunos sublenguajes o terminologías. Además, algunos errores y problemas que contenía WordNet 1.5 fueron revisados y corregidos (errores en caracteres de las unidades léxicas y glosas, relaciones erróneas, etc.). Esta tabla muestra algunas diferencias:1

 

WordNet 1.5

ConceptNet 1.0 (Inglés)

ConceptNet 2.0 (Inglés, Francés, Alemán)

Categoría Gramatical

Sustantivos, Verbos, Adjetivos, Adverbios

Sustantivos, Verbos, Adjetivos, Adverbios

Sustantivos, Verbos, Adjetivos, Adverbios

Nombre de Relaciones

Synonym (synset),
Antonym,
Hyperonym,
Hyponym,
Member Meronym,
Substance
Meronym,
Part Meronym,
Member Holonym,
Substance
Holonym,
Part Holonym,
Attribute,
Entailment,
Cause,
Also see,
Pertains to
Derived from,
Similar to

Full Synonym,
Non full Synonym,
Related Words,
Antonym,
Hyperonym,
Hyponym,
Place Meronym,
Member Meronym,
Substance
Meronym,
Part Meronym,
Place Holonym,
Member Holonym,
Substance
Holonym,
Part Holonym,
Attribute,
Entailment,
Cause,
Pertains to,
Derived from

Multilingual Equivalence,
Full Synonym,
Non full Synonym,
Related Words,
Antonym,
Hyperonym,
Hyponym,
Place Meronym,
Member Meronym,
Substance Meronym,
Part Meronym,
Place Holonym,
Member Holonym,
Substance Holonym,
Part Holonym,
Attribute,
Entailment,
Cause,
Pertains to ,
Derived from

Nº de Significados

91591 99953 102.000(1)

Nº de Unidades Léxicas

126520 127.000 Inglés= 127.000(1)
Francés= 40000-50000(1)
Alemán= 40000-50000(1)

Nº de Conexiones

Miembros de Synsets
= 168217
Resto de conexiones = 219133
Miembros de Synsets
= 177.750
Resto de conexiones
= 395.000
Miembros de Synsets

Inglés= 180.000(1)
Francés= 100.000(1)
Alemán= 100.000(1)
Resto de conexiones = 400.000(1)

Nº de Glosas

76705 (83.7% de significados) 99953 (100% de significados)

102.000(100% de significados)

(1) El Multilingual ConceptNet está en proceso de desarrollo y las cifras son la proporcionadas en un comunicado de prensa en mayo de 1996.

    Como podemos observar, en cuanto a las meronimias, ConceptNet distingue las meronimias lugar-área para los nombres geográficos y espaciales. Éstos forman pues un grupo de jerarquías meronímicas diferenciadas del resto que permite el tratamiento de algunos problemas específicos.2


NOTAS

1   Díez Orzas (1995).

2  Ver Clementini & Di Felice (1994).

 

Anterior  I  Siguiente  I  Índice capítulo 3  I  Índice General


ISSN: 1139-8736
Depósito Legal: B-25223-99