Los diarios

En nuestro caso los diarios, usando una mirada sistemática podemos decir que los diarios son un conjunto de noticias y que a su vez esas noticias podemos conformarlas por descriptores, para su indización en la base de datos.

Las ventajas de usar descriptores para la base de datos, en vez de texto completo o resumen, son varias, pero en lineas generales, se obtiene un mejor resultado de búsqueda ya que se eligen las palabras que representen mejor al documento. Se obtiene un índice de palabras que contiene la base de datos, que luego puede ser ordenada para el usuario. Para hacerlo más simple clasificamos a los descriptores en categorías generales. Nombrando a las categorías generales como categorías y a los descriptores como subcategorías.

Veamos un ejemplo. Supongamos que tenemos los siguientes descriptores conformado por categoria, subcategoria:

Sociedad, Fotografía
Sociedad, Baile
Local, Guadalupe
Lugar, Rambla López
Interpretamos que hay fotografías en la noticia, que es una noticia social, de un baile en Guadalupe en el lugar preciso de la “Rambla López”.

Otra ventaja que se obtiene, es la de obtener un márgen de error en carga más pequeño. Primero de todos porque se obliga al cargador a pensar cuál es el término que se deberá usar para representar la noticia. Además debe constatar que dicha palabra no se encuentre ya cargada de otra forma similar, y así evitar ambiguedades. Segundo se puede corregir de manera muy fácil el error cometido y afectará a todos los registros cargados, y no deberá preocuparse si cometió errores en otros registros.

Categorías desplegadas por el programa.

Categorías desplegadas en la página.

Al final del trabajo quedará conformada una base de datos de los diarios, y otra con los descriptores usados (tesauro), la cual podrá ser reutilizada para otras base datos. De esta forma podremos consultar por ejemplo las personas que aparecen en los diarios, los lugares, etc.