La aparición de nuevos dispositivos móviles para conectarse a Internet y la evolución propia de las tecnologías de búsqueda de información en Internet junto a las nuevas formas de buscar, están cambiando rápidamente el panorama de las búsquedas de información.
Pensemos por un momento en las búsquedas por voz y como estas se han integrado en el nuevo algoritmo de Google, Humminbird, dándoles cierta preferencia sobre las búsquedas más tradicionales basadas en palabras clave.
Por no hablar del crecimiento y especialización de la web profunda. Cada vez un recurso más útil y mejor explotado.
Lo cual nos lleva a cuestionarnos sobre:
¿cuál es el futuro de la búsqueda de información en Internet?
Muchas son las dudas al respecto. El consenso de los expertos nos habla de:
Contenidos
Un futuro en el que la búsqueda de información pasa por las manos de máquinas inteligentes capaces de entender lo que están leyendo como si de un humano se tratase.
Es lo que se conoce como la web semántica.
Sin embargo, antes de responder a la pregunta sobre el futuro de la búsqueda de información en Internet, veamos que se decía hace más de 10 años sobre esto y comparémoslo con el presente para ver que ha ocurrido.
Como se veía el futuro de la búsqueda de información en Internet hace 10 años
Si damos marcha atrás en la máquina del tiempo y vemos que es lo que se decía sobre el futuro de la búsqueda de información en Internet en el 2003, podemos resumirlo casi todo en esta frase:
[box border=»full»]El futuro de la web es la web semántica o inteligente y por lo tanto un motor de búsqueda podrá interpretar nuestras búsquedas y responder directamente con la información que buscamos
¡Vaya sorpresa! El futuro de la web en el 2003 y por tanto de la búsqueda de información en Internet pasaba por la web semántica.
Pero pongamos en contexto.
A mediados de los 90, antes de que el mayor motor de búsqueda del mundo existiera, Yahoo y Altavista eran los grandes dominadores del mercado.
Siendo Yahoo! un directorio de webs subidas y filtradas a mano, ¡Si a mano!
Es en este contexto cuando los buscadores empiezan a incorporar las técnicas de link crawling y elaborar los algoritmos para automatizar este proceso. Bajo este mundo nace Google, cambiándolo todo a partir de 1998 y es en este punto cuando todo parece posible.
Sin embargo frente al consenso de prensa y desarrolladores que anunciaban la llegada de una Web Semántica «inteligente» me parece revelador el estudio que publicó Lluis Codina en junio de 2003 sobre el futuro de la búsqueda de información en Internet.
Precisamente por:
- Descartar la llegada inminente de la web semántica. Que para el y su equipo no llegaría ni a corto ni medio plazo y difícilmente en un plazo de 10 años.
- Resaltar la importancia de la Internet profunda en el futuro de la búsqueda de información con la aparición de motores específicos para rescatar parte de sus informaciones como Scirus.
Con respecto al primer punto, Luis dio completamente de lleno. Y aunque Google es capaz de introducir cada vez más inteligencia a sus resultados, esta lejos de la imaginada web semántica. Por lo tanto a día de hoy, este punto sigue estando plenamente vigente.
En cuanto al segundo punto se ha demostrado que estaba en lo cierto y no solo Scirus se ha consolidado sino que existen otros muchos buscadores de la web profunda.
Y es precisamente aquí, en la web profunda, donde se encuentra el presente de las búsquedas de información en Internet.
El presente de la búsqueda de información en Internet
Hace más diez años el gran avance de las búsquedas de información fue la automatización del proceso de búsqueda por parte de los buscadores.
La técnicas de spaidering también conocidas como link crawling, permitieron dar un salto cualitativo a los motores de búsquedas al permitirles indexar de manera automática la web.
De esta forma pueden presentar resultados a los usuarios en tiempo casi real.
Sin embargo esta técnica no es perfecta y deja bastantes contenidos fuera, dando una oportunidad al desarrollo de aplicaciones que recuperen estos datos. Básicamente nos estamos refiriendo a las páginas web con contenidos dinámicos (bases de datos) no indexables, que forman el grueso de la Internet profunda.
En la actualidad, los buscadores siguen empleando el link crowling como base para ofrecer sus resultados.
Lo cual implica que gran parte de los contenidos de la web siguen sin estar indexados por estos. Contenidos que cada vez son mayores. Por eso:
Son las técnicas y herramientas de recolección automática o de búsqueda en la Internet profunda las que constituyen el presente de las búsquedas de información en Internet.
Entre estas técnicas se encuentran las herramientas de vigilancia e inteligencia competitiva. Preparadas para acceder de forma automatizada a la web profunda y crear un dataset de datos o repositorio de informaciones personalizado.
Cómo llegar al futuro de las búsquedas de información: aprovechando la web profunda
Si de alguna manera queremos llegar al futuro de la búsqueda de información en Internet no tendremos más remedio que aceptar que los motores de búsqueda tienen sus limitaciones y que parte de la información que buscamos se encuentra bien guardada en la Internet profunda, esperando a que vengas a recogerla.
Por supuesto esto proceso se puede hacer de forma manual pero el futuro implica mejora y por lo tanto automatización.
Veamos algunas alternativas disponibles:
- Emplear una plataforma de inteligencia competitiva que incorpore las programaciones necesarias para recopilar la información de la Internet profunda es una manera de llegar a este futuro.
- También contratar un servicio que te ofrezca los datos e informaciones en formatos que puedan ser leídos por máquinas como un CSV que puede ser procesado por una hoja de calculo.
- O bien pagar por la configuración de un programa que nos recupere la información que buscamos en un repositorio disponible para tal efecto.
Con la ayuda adecuada es fácil plantarse en el futuro de la búsqueda de información en Internet. Si quieres saber cómo contactarme aquí.
En una galaxia lejana muy muy lejana…o tal vez no?
Es posible que en el futuro la web sea semántica y la búsqueda de información en Internet arrojen resultados espectaculares sin necesidad de más complicaciones.
Pero ese futuro puede tener lugar dentro de bastante tiempo… o a lo mejor me equivoco mucho y dentro de 10 años la web semántica será una realidad. Y de esta forma todas las páginas web presentarán nuevas etiquetas y hayan incorporado metadatos con semántica y sintaxis. Casi nada.
Podemos concluir por lo tanto que el presente y el futuro inmediato de las búsquedas de información esta en la Internet profunda a través de la aplicación de técnicas del deep web harvesting.
Si tienes alguna duda o estas interesado en nuestros servicios de utiliza el hilo de comentarios o bien puedes contactarme y mandarme tu pregunta aquí.
Recuerda lo bueno se comparte a si que no te olvides de darle a los botones sociales.
Photo by Robert Scoble