Los motores de búsqueda son herramientas básicas para toda persona que desea navegar por internet, ya que nos permiten acceder a una enorme cantidad de páginas webs con todo tipo de información y contenidos. Sin embargo, existen algunas páginas a las que no se puede acceder desde estos motores de búsqueda, porque incluyen contenidos no indexados. Estas se agrupan bajo el término deep web o “internet profunda”.
La principal razón de que exista este concepto es la imposibilidad de los motores de búsqueda, como Google, Yahoo o Bing, de encontrar e indexar gran parte de la información existente en internet. Incluso, si fuesen capaces de indexar las páginas que hoy integran la deep web, esta seguiría existiendo, porque agruparía a las páginas privadas.
Tipos de contenido
Los motores de búsqueda no pueden indexar algunas páginas por las siguientes razones:
- Documentos o información oculta. Pueden ser archivos PDF que no se encuentran en las páginas indexadas o figuran en listas de datos que no son públicas. Estos últimos contenidos suelen asociarse con los cibercriminales.
- Webs contextuales. Páginas cuyo contenido varía según el contexto (dirección IP de los clientes, historial de visitas anteriores, etc.).
- Contenido de acceso restringido. Páginas protegidas con contraseña, contenido protegido por un captcha, etc.
- Contenido no HTML. Contenido textual en archivos multimedia y archivos con otras extensiones (exe, rar, zip, etc.).
- Software. Contenido oculto de manera intencional, cuyo acceso requiere de un programa o protocolo específico (Tor, I2P, Freenet, etc.).
- Páginas no enlazadas. Páginas de cuya existencia no tienen referencia los buscadores. Pueden ser aquellas páginas que no tienen enlaces desde otras páginas.
La deep web también facilita la navegación por internet sin ningún tipo de monitoreo, es decir, nada que se haga en esta zona puede asociarse con la identidad de los usuarios. Sin embargo, y pese a que existen muchos mitos al respecto, no es una región prohibida o mística de internet, y la tecnología relacionada con ella tampoco es necesariamente conspirativa, peligrosa o ilegal.
Por el contrario, la deep web alberga algunos recursos de difícil acceso mediante métodos comunes, como redes internas de instituciones científicas y académicas con información sobre avances tecnológicos, publicaciones recientes, etc. UTEC, a través de carreras como Ciencia de la Computación, forma profesionales con amplios conocimientos sobre gestión de datos, para evitar su filtración en este tipo de páginas webs no indexadas.
Somos la universidad que tiene Inteligencia Artificial en el 100% de sus programas académicos. En UTEC tenemos una modalidad de admisión que se adapta a ti. Regístrate aquí e inicia tu postulación hoy.