RECUPERACION DE INFORMACION - EL DOCUMENTO

DOCUMENTO ELECTRÓNICO 
Es aquel que se encuentra contenido en un soporte electrónico que para visualizar su información contenida requiere de soporte material eléctrico o magnético.

DOCUMENTO DIGITAL 
      Es la secuencia de bits (unos y ceros) que representan información.
     Representación de documentos, imágenes, sonidos, etc., en un medio digital.

DOCUMENTO VIRTUAL
       Se construye en un lapso de tiempo, es decir solo existe en el momento en que es requerido.
       Se construye a partir de las bodegas de datos
       Es muy importante en recuperación

COMPONENTES DE UN DOCUMENTO
El documento está compuesto por 4 elementos importantes


1- Estructura: Se refiere a los elementos constitutivos del documento
2- Contenido: El mensaje que transmite el documento
3- Formato: Se refiere a su visualización
4- Contexto: son los metadatos, vocabularios controlados, validación

DOCUMENTO ESTRUCTURADO
Se estructuran sus partes visiblemente por medio de campos descriptivos que permiten recuperar fácilmente por una máquina.

Es aquel que lleva su estructura a través de etiquetas por ejemplo las marcas del lenguaje HTML, XML, SGML, etc.

DOCUMENTO NO ESTRUCTURADO
Se encuentra normalmente en texto completo sin tipo de marcado sin representación de datos dificultando la recuperación de información.

DOCUMENTO SEMI-ESTRUCTURADO
Además del contenido del documento, consta de datos extra para dividir el documento en partes de tal forma que cada una tenga un significad, facilitando su esquema por ejemplo en los repositorios, registros bibliográficos, etc.

Referencias:
Memorias de Clase
- Felipe Gomez Dueñas
http://uvirtual.lasalle.edu.co/file.php/562/Bibliografia/LOS_DOCUMENTOS_DE_TEXTO_Y_SU_ESTRUCTURA.pdf

No hay comentarios:

Publicar un comentario