RedIRIS

Estudios de Lingüística del Español

Volumen 10 (2000)
ISSN: 1139-8736
Depósito Legal: B-14103-2000


Tratamiento automático de la información textual en español mediante bases de información lingüística y transductores

 

Carlos Subirats Rüggeberg y Marc Ortega Gil

Laboratorio de Lingüística Informática, Universidad Autónoma de Barcelona


Índice general

Resumen

Introducción

1 Desarrollo de herramientas de tratamiento de corpus

1.1 Analizadores léxicos que etiquetan las formas simples y/o compuestas de un texto a partir de la información de un diccionario electrónico
1.2 Creación de subdiccionarios electrónicos de las formas simples y/o compuestas (locuciones) de un corpus
1.3 Un compilador de expresiones regulares y un generador de autómatas gráficos
1.4 Reconocimiento de construcciones sintácticas

2 Corpus de Verificación

3 Herramientas de tratamiento automático de la información textual

3.1 Conversión de un texto en un autómata finito determinista (AFD) minimizado, etiquetado con la información de un diccionario electrónico
3.2 Algoritmos de intersección de autómatas, que permite desambiguar el AFD resultante de una etiquetación

4 Relaciones de predicación e información textual

4.1 Algoritmos de intersección de autómatas
4.2 Conversión de un diccionario electrónico en un transductor
4.3 Bases de información sintáctica
4.4 Conversión de redes de relaciones semánticas en autómatas finitos deterministas

5 Conclusiones

Anexo

Referencias

 


ISSN: 1139-8736
Depósito Legal: B-14103-2000