RECUPERACIÓN DE LA INFORMACIÓN
PRÁCTICA 1 – Normalización de documentos
Usando el lenguaje de programación C el alumno deberá construir un programa que permita la normalización documentos de texto. Las características del sistema son las siguientes:
a) Cada documento es un fichero de texto puro con extensión .txt
b) Hay un fichero de “palabras vacías” que deberá usarse para preprocesar cada documento con el fin de obtener su representación normalizada.
c) Cada documento normalizado es representado mediante una serie de términos en un fichero de texto de igual nombre con extensión .rep
d) La normalización del documento consistirá en eliminar las palabras vacías, convertir mayúsculas a minúsculas y eliminar tildes y signos de puntuación, admiración e interrogación. e) El programa dispondrá de un menú para ver la lista de documentos, visualizar uno de ellos en su versión original y en su versión limpia y normalizada..
Se deberán entregar todos los ficheros utilizados, incluyendo el programa fuente en C, y un informe en formato PDF sobre los criterios de diseño e implementación de cada