next up previous
Next: Introducció

Informe final: Lematització automàtica de textos valencians antics mitjançant tècniques d'estats finits

Alícia Garrido, Amaia Iturraspe, Sandra Montserrat,
Hermínia Pastor i Mikel L. Forcada

Departament de Llenguatges i Sistemes Informàtics,
Universitat d'Alacant,
E-03071 Alacant, Spain.

Abstract:

Es presenta la primera versió d'una eina informàtica que llig un text en català antic i retorna un text en què cada mot del text original identificat va acompanyat de una o més anàlisis morfològiques possibles (cada una de les quals indica el lema o la forma canònica del mot i la informació sobre la flexió). Aquesta eina --que analitza milers de mots per segon-- es genera automàticament en pocs minuts --usant un programa compilador-- a partir d'un diccionari morfològic (un arxiu de text que conté els lemes, els paradigmes de flexió, i els paradigmes de variació gràfica més comuns); açò fa que el sistema es puga estendre i refinar indefinidament.



 

Mikel L. Forcada
1999-10-29