La compilación de corpus es una tarea costosa y compleja, para la que hoy en día las herramientas informáticas son indispensables. Es, pues, uno de los objetivos de las herramientas de corpus el ayudar a crearlos y gestionarlos. La Fundación Elhuyar ha desarrollado la herramienta Corpusgile con este fin.
Por otro lado, Internet ha abierto nuevas oportunidades para la creación de corpus y la lingüística de corpus. Las ventajas son claras: un enorme repositorio de textos continuamente creciente, ya digitalizado, al alcance de cualquiera... Hay dos puntos de vista a la hora de unir Internet y corpus. Una es consultar Internet directamente como si fuera un corpus (web as corpus). La herramienta CorpEus desarrollada en Elhuyar es de este tipo. La otra es utilizar Internet como fuente de textos para la creación de corpus (web for corpus). La herramienta Co3 que estamos desarrollando actualmente es de este segundo tipo.
Por último, es importante también disponer de herramientas para la consulta, explotación y obtención de información de los corpus. Elhuyar ha desarrollado herramientas automáticas de extracción de léxico y terminología a partir de corpus.
Copyright © 2007 Elhuyar Fundazioa | Aviso legal | Mapa web | Erabiltzaile-kopurua: 856789
Diseinua: Blanco