3.3.2 Sistemas basados en el conocimiento

ISSN: 1139-8736
Depósito Legal: B-35510-2000

3.3.2 Sistemas basados en el conocimiento

The argument for interlingual KBMT is a simple one: Accurate translation requires comprehension. The main product of the comprehension is a semantic representation of the meaning of the source text, which can be exploited as the interlingua if designed in a sufficiently language-neutral manner. Ergo, in-depth understanding kills the two proverbial birds with one computational stone, the ambiguity resolution problem and eliminating the need for N² transfer grammars.

(Carbonell, Mitamura & Nyberg 1992:227)

El segundo de los más recientes paradigmas de TA, que se puede considerar como una evolución de los primitivos sistemas de interlingua, es la traducción automática basada en el conocimiento (KBMT: Knowledge-Based Machine Translation). Este tipo de TA, por el cual abogaremos en este trabajo, supone una línea de investigación radicalmente diferente de la anterior. Si en la TA basada en estadística la tendencia es no utilizar información alguna que no sea la que se desprende del texto en sí, en la KBMT se persigue la creación y utilización en el proceso de traducción de un vasto depósito de información, no sólo lingüística sino también de conocimiento del mundo y/o del dominio específico de traducción. Esta característica podría considerarse como la fundamental; por ello, los sistemas que implementan este tipo de enfoques persiguen la creación de extensas y bien estructuradas bases de datos y bases de conocimiento.

La TA basada en interlingua y la TA basada en el conocimiento no son el mismo concepto, aunque se puede adoptar tal visión extrema de la situación (Carbonell, Cullingham & Gershman 1981).

Como vimos en el apartado 3.2.3, la TA de interlingua requiere que una interpretación del texto de origen sea plasmada en una representación independiente de las lenguas en cuestión para su posterior generación en una o más lenguas meta, con el objeto de eliminar el "problema N²" de los sistemas multilingües de transferencia. La KBMT, sin embargo, presupone la aplicación de conocimiento semántico y pragmático, además, por supuesto, del sintáctico y léxico, con el objeto de producir mejores interpretaciones del texto de origen y por consiguiente mejores traducciones. Se puede concebir, por ejemplo, un sistema de KBMT basado en transferencia semántica. Tal sistema utilizaría todos los recursos que un típico sistema de KBMT usa para producir la interlingua pero generaría una representación semántica dependiente de la lengua meta. Por tanto, estrictamente hablando, cabe distinguir entre sistemas de KBMT y sistemas interlingües de KBMT, aunque por lo general no se suele hacer tal distinción (estaríamos desaprovechando las ricas representaciones semánticas generadas por un sistema de KBMT, que pueden ser usadas como interlingua).

La premisa básica de la KBMT es que para conseguir una traducción de calidad y precisión es necesaria una completa interpretación semántica del texto origen (Carbonell & Tomita 1987). Por tanto los componentes de análisis y generación de un sistema de KBMT deben poseer al menos los siguientes componentes (Mitamura & Nyberg 1992):

una gramática para la lengua
un lexicón para la lengua
un conjunto de conceptos para el dominio (ontología)
un conjunto de reglas que proyecten estructuras sintácticas sobre estructuras semánticas para el análisis
un conjunto de reglas que proyecten estructuras semánticas sobre estructuras sintácticas para la generación

Como ya podemos intuir, el proceso de traducción no difiere en lo esencial de los sistemas de TA tradicionales. Sin embargo, existen diferencias importantes. En primer lugar, y como característica distintiva, se pretende usar conocimiento del dominio subyacente a la traducción. En última instancia, esto implica la existencia de una base de conocimiento (KB: Knowledge Base) que sirva de soporte para la ontología de conceptos. Esta ontología será utilizada como referencia importante en varias etapas del proceso de traducción, especialmente durante el proceso de desambiguación, que, como ya hemos visto, es indudablemente el problema de más difícil solución que la TA presenta.

No cabe duda de que la necesidad de incluir una KB en el sistema de traducción, supone otros muchos problemas, a nivel de compilación, diseño, implementación y manejo, que no existen en otros enfoques a la TA; pero también pensamos que al mismo tiempo este reto ofrece la posibilidad de profundizar en los procesos que la mente humana sigue para obtener una traducción de alta calidad y, más aun, en la naturaleza misma del lenguaje natural, especialmente en lo que se refiere a la relación entre conocimiento lingüístico y conocimiento del mundo.

Otra premisa importante de la KBMT es que la TA requiere el uso de niveles de representación lingüísticos (morfología, semántica, etc.) para los lexemas del dominio en cuestión (Lonsdale, Mitamura & Nyberg 1995). Como hemos visto, un sistema de transferencia semántica utiliza conocimiento declarativo y un conjunto de reglas para proyectar la semántica de la lengua de origen sobre representaciones semánticas de la lengua meta. Un sistema de KBMT, al igual que los sistemas basados en interlingua primitivos, hace uso normalmente de un nivel de representación intermedio adicional que pretende ser independiente de las representaciones semánticas origen y meta.

En realidad deberíamos disponer de una definición concreta sobre qué es una interlingua y cuáles son los métodos que deben guiar la creación de la ontología de conceptos que habrá de ser usada como referencia para la interlingua. En el entorno de la KBMT una interlingua se entiende como una notación que sirve para representar el significado proposicional y pragmático de los textos de entrada. Concretamente, una interlingua consiste en tres elementos (Hovy & Nirenburg 1992):

Una colección de términos: los elementos que representan los significados individuales (de unidades léxicas, aspectos pragmáticos, etc.). Esta colección debería estar organizada en una red semántica interconectada.
Una notación: la sintaxis a la que los textos bien formados de interlingua se ciñen.
Un substrato: el sistema de representación de conocimiento sobre el que los textos de interlingua son instanciados y que contiene la infraestructura necesaria para razonar con el conocimiento codificado en los textos de interlingua.

El término "red semántica" puede ser contemplado en principio, y hasta que no lo definamos formalmente en el siguiente capítulo, como un lexicón conceptual de distinciones de significado que representan entidades en el mundo. En principio, la tarea de construir un modelo completo del mundo es considerada una tarea no factible en un plazo previsible, por lo que la estrategia adoptada generalmente por los sistemas de KBMT que pretenden ser funcionales es la de producir un subconjunto en el que cada una de las definiciones o descripciones de los distintos términos contenga la suficiente información como para distinguirlo de todos los demás, siempre dentro de este "submundo".

Este "subconjunto conceptual", es normalmente denominado dominio. Incluso dentro de un dominio reducido el volumen de información puede llegar a ser abrumador por lo que se requieren técnicas de Inteligencia Artificial para facilitar su creación. Especialmente, la taxonomización y la herencia de propiedades son clave para permitir brevedad definicional y capacidad de expresión. Por otra parte, cualquier dominio incluye un conjunto de términos (generales) que estarán presentes en la mayoría (si no en todos) los demás dominios. Por supuesto, éstos se encuentran en los nodos superiores de la red, próximos a la raíz de la jerarquía. Estos términos generales, que se suponen compartidos por la mayoría de los submundos, es lo que se suele denominar ontología, que servirá de referencia primera para la interlingua. El resto del dominio particular, que contiene los términos más específicos y que no se suponen compartidos por otros dominios es denominado un modelo de dominio. Aunque el límite entre una ontología y un dominio es bastante difícil de distinguir de forma abstracta, en la práctica, para cualquier conjunto de modelos de dominio, la detección de los niveles superiores (compartidos) no plantea dificultades.

El principal propósito de una ontología y un modelo de dominio en la KBMT es el análisis y generación centrados en la semántica. La idea es definir el significado de las unidades léxicas de una lengua utilizando términos de la ontología y el modelo de dominio. Estas conexiones entre los términos de la ontología y las unidades léxicas de las distintas lenguas naturales deben ser hechas explícitas en los lexicones individuales de cada una de esas lenguas. De este modo la ontología sirve como punto de encuentro entre las diversas lenguas, y puesto que todas ellas comparten un mismo modelo del mundo, es posible la traducción entre ellas.

En este ámbito hemos de volver a discutir el debate ya mencionado en el apartado 3.2.3 sobre la viabilidad de la construcción de una representación independiente del lenguaje, es decir, una interlingua. Puesto que la ontología supone el punto de encuentro de las distintas lenguas, ésta ha de suponer forzosamente una representación conceptual "neutral" con respecto a todas estas lenguas. Resulta obvio que, puesto que las tareas de selección, definición y taxonomización de los conceptos a incluir en una ontología y un modelo de dominio son llevadas a cabo por personas con una lengua materna y un entorno social y cultural determinado, es muy probable que todo esto se deje notar en el resultado de su trabajo. Sin embargo, el enfoque de los investigadores en este sentido suele ser (y debe ser) tremendamente práctico. El objetivo es conseguir una interlingua que sea neutra con respecto al lenguaje, queriendo esto decir que "permita a los analizadores y generadores operar en condiciones óptimas en un sistema de traducción automática" (Hovy & Nirenburg 1992) y por tanto el mismo criterio se aplica a la construcción de ontologías.

Pensamos que el mejor modo de ver cómo funciona un sistema de TA basado en el conocimiento es estudiar los distintos sistemas propuestos hasta la fecha, aunque en realidad los más importantes son evoluciones de un mismo sistema. No es extraño que éste sea el caso, pues la construcción de una ontología, requisito inmediato para un sistema de KBMT, es una ardua labor de equipo y una inversión a largo plazo.

La investigación más importante llevada a cabo en el terreno de la KBMT ha venido siendo desarrollada en el Center for Machine Translation de la Universidad de Carnegie Mellon (CMU/CMT). Aquí se desarrolló el primero de los sistemas de este tipo, KBMT-89. En sucesivos proyectos se unieron el Computing Research Laboratory de la New Mexico State University (NMSU) y el Information Sciences Institute (ISI) de la Universidad de California del Sur. También en la Universidad de Maryland se ha realizado investigación en este campo. Se puede decir por tanto que la TA basada en conocimiento es un tipo de investigación netamente estadounidense.

En el resto de este importante apartado analizaremos cuatro sistemas que suponen en realidad un único trabajo de investigación. Los fundamentos se encuentran en el sistema KBMT-89, por lo que lo analizaremos en bastante detalle. Los sistemas KANT y Pangloss fueron sus sucesores. Finalmente, el sistema Mikrokosmos es la última evolución, hallándose aún en fase de investigación. Es muy importante para nuestro trabajo que nos detengamos a analizar estos sistemas porque, además de usar muchas de las metodologías, tanto computacionales como lingüísticas, que nosotros defendemos, en el presente trabajo se ha utilizado la ontología desarrollada por este equipo de investigación para generar nuestra propia base de conocimiento, que introduciremos en el Capítulo 5.

Anterior I Siguiente I Índice capítulo 3 I Índice General