martes, 10 de noviembre de 2015

Caracterización de la Web Superficial y la Web Profunda

Cuando hablamos de web superficial nos referimos a cuando los buscadores ofrecen una pequeña fracción de lo que realmente existe online por tanto la web profunda vas un tanto más allá. Es una amplia gama de información ubicada   en catálogos y otros tipos de contenidos que no aparecen en una búsqueda convencional.

  1. La web superficial: enfoca todo aquello sitios en donde la información puede ser organizada por  el robot de los buscadores convencionales y ser recuperada casi en su totalidad.


Características:

  • ·         Es de libre acceso
  • ·         No  requiere registrarse para poder acceder a  la información
  • ·         está compuesto por páginas web estáticas

  1. La web profunda o invisible: este término pertenece a toda la información disponible o acumulada en internet que no se recupera interrogando a los buscadores convencionales y es  asequible mediante base de datos. Parte de la información es invisible para los robots de los buscadores convencionales  porque los resultados generan una respuesta en la pregunta directa mediante páginas dinámicas.

Estas se sub divide en cuatro categorías según Sherman y Price:

  • La web opaca: está compuesto por archivos que pueden o no estar en los índices de los buscadores, ya sea por extensión de la indexación, números máximos de resultado visible, url desconectadas etc.
  • Web privada: son fundamentada  en páginas web que pueden estar indexadas en los buscadores pero pueden estar excluida por que la página web está protegida por contraseña, contiene un archivo robot para evitar ser indexadas etc.
  • Web propietarias: contiene  páginas en la que es necesario registrarse para tener acceso al contenido  ya sea gratis o pagando.
  • Web realmente invisible: está compuesta de páginas que no pueden ser indexadas por limitaciones técnicas de los buscadores, programas ejecutables o archivos comprimidos,  es decir ,que se  generan a partir de datos que introduce al usuario, información almacenada, qué no pueden ser extraída a menos que realicen una petición en especifica.

 Algunos recurso de web profunda:

  • The wwwvirtual library
  • Infoplease
  • Techxtra

No hay comentarios.:

Publicar un comentario