viernes, 4 de marzo de 2016

Caracterización de la web invisible o profunda


En 1994, la Dra. Jill Ellsworth, especializada en el estudio de Internet, utilizó el término Web invisible, por primera vez, para denominar a la información que resultaba “invisible” para los motores de búsqueda convencionales en el Web. También, se denomina “Web profundo” (Deep Web), por oposición a la “Web superficial” (Surface Web) cuya información puede recuperarse con los buscadores de Internet. La existencia de esta denomina red profunda es un producto de la metodología que utilizan los buscadores para indexar las páginas. El mecanismo se basa en programas llamados robots o arañas, que recorren las páginas de la red siguiendo los enlaces que presentan o se dirigen hacia ellas. Cuando se utiliza alguno de los buscadores conocidos, no se busca en toda la red, sino en su base de datos, construida gracias a la acción de los robots.

En el año 2000, un estudio de la consultora estadounidense BrightPlanet, elaborado por Michael Bergman, confirmaba y explicaba la existencia de una red profunda que tendría aproximadamente 7 500 terabytes (equivalente a 7 500 billones de bytes) de información frente a los 19 de la Web superficial o parte de la red accesible mediante los buscadores convencionales.

Actualmente, existen herramientas orientadas específicamente a la labor de recuperar información en el Web profundo como: buscadores, agentes de búsquedas, índices generales y portales verticales. Estas herramientas facilitan el acceso a una mayor parte del Web, porque, además de buscar en el Web superficial, buscan en el Web profundo también, inaccesible para la mayor parte de los buscadores tradicionales.


Sherman y Price (2001a) identifican cuatro tipos de contenidos invisibles en la web: la web opaca (the opaque web), la web privada (the private web), la web propietaria (the proprietary web) y la web realmente invisible (the truly invisible web).




Herramientas de búsqueda en la web profunda

Buscadores

En general, los buscadores han mejorado su desempeño en los últimos años, permitiendo un mayor nivel de precisión en las búsquedas y ofreciendo los resultados en formas cada vez más convenientes para el usuario.

Pero por ahora, los buscadores comunes sólo pueden recuperar directamente la información que se encuentra disponible en la web y no aquella que se ofrece a través de la web. Desde que se empezó a hablar de la web invisible los buscadores comunes han añadido funcionalidades adicionales para la búsqueda en la llamada web profunda y han surgido buscadores especializados en ese segmento de la web. Estos últimos permiten la búsqueda directa de artículos y documentos en texto completo y recuperan archivos PDF o PostScript.

Metabuscadores

Como hemos visto, los metabuscadores pueden presentar limitaciones respecto a las posibilidades de búsqueda de cada buscador por separado. Por ejemplo, cuando la búsqueda es sobre materiales o formatos especiales, resulta más práctico sacar provecho de las opciones avanzadas de búsqueda de los buscadores y, si es necesario, realizar búsquedas sucesivas en varios de ellos. En este sentido, son más recomendables los directorios concentradores de buscadores.

Directorios

La mayoría de los mecanismos que se usan para localizar recursos en la web profunda consisten en directorios de recursos especializados, principalmente bases de datos disponibles de forma gratuita en la red. El patrocinio de las instituciones académicas en la elaboración de los directorios, particularmente de los que son anotados, garantiza la cobertura y calidad de los recursos compilados.

Guías

Las guías de recursos especializados generalmente están elaboradas por bibliotecarios y son una excelente herramienta de búsqueda y localización de recursos, además de constituir un buen instrumento de aprendizaje en el uso de la información.

Tutoriales

Las páginas ya mencionadas How to Choose a Search Engine or Directory de la Universidad de Albany en Estados Unidos y las guías de SearchAbility y de la Universidad de Leiden en Holanda A Collection of Special Search Engines incluyen los recursos de información y estrategias búsqueda en la web profunda.

Motores avanzados

Finalmente, los recientes motores de pregunta dirigida (directed query engines) tienen la capacidad de realizar búsquedas simultáneas en varias bases de datos en la web. Lexibot y su sucesor, Deep Query Manager, así como Distributed Explorer (Warnick y otros, 2001) y FeedPoint, son ejemplos de estos motores avanzados de búsqueda.



Recursos de búsqueda en la Web Profunda

Recursos
Tipo
About
http://www.about.com/
Guía
AcademicInfo
http://www.academicinfo.net/
Directorio
AlphaSearch
http://www.alphasearch.org/
Directorio de buscadores
Beaucoup
http://www.beaucoup.com/
Directorio de buscadores

The Big Hub
http://www.thebighub.com/
Directorio

iBoogie
http://www.iboogie.tv/
Metabuscador

Collection of Search Engines
http://www.leidenuniv.nl/ub/biv/specials.htm
Directorio de buscadores

CompletePlanet
http://www.completeplanet.com/
Directorio

Deep Query Manager (sustituye a Lexibot)
http://brightplanet.com/news/dqm2.asp
Motor avanzado

Direct Search
http://www.freepint.com/gary/direct.htm
Directorio

Fazzle
http://www.fazzle.com/
Metabuscador

FeedPoint
http://www.quigo.com/feedpoint.htm
Motor avanzado

Fossick
Metabuscador

HotSheet
http://www.hotsheet.com/
Directorio

IncyWincy
http://www.incywincy.com/
Directorio

Infomine
http://infomine.ucr.edu/
Directorio

InternetInvisible
http://www.internetinvisible.com/
Directorio



Recursos de búsqueda en la web profunda

Tipo de recurso

Buscadores
ResearchIndex (CiteSeer)
http://citeseer.nj.nec.com/cs
Scirus
http://www.scirus.com/
WebSearch
http://www.websearch.com.au/
Metabuscadores iBoogie
http://www.iboogie.tv/
Fazzle
http://www.fazzle.com/
Fossick
http://fossick.com/
Ixquick
http://www.ixquick.com/
ProFusion
http://www.profusion.com/

Estrategias y mecanismos de búsqueda en la web invisible
Search.Com
http://www.search.com/

Directorios de buscadores
AlphaSearch
http://www.alphasearch.org/
Beaucoup
http://www.beaucoup.com/
Collection of Search Engines
http://www.leidenuniv.nl/ub/biv/specials.htm

Directorios
The Big Hub
http://www.thebighub.com/
CompletePlanet
http://www.completeplanet.com/
Direct Search
http://www.freepint.com/gary/direct.htm
HotSheet
http://www.hotsheet.com/
IncyWincy
http://www.incywincy.com/
Infomine
http://infomine.ucr.edu/

Internet Invisible
http://www.internetinvisible.com/
Internets
http://www.internets.com/

Estrategias y mecanismos de búsqueda en la web invisible
InvisibleWeb.com
http://www.invisibleweb.com/
Invisible Web Directory
http://www.invisible-web.net/
Librarians Index
http://lii.org/
Master Link List On the Internet
http://www.web-friend.com/links/masterlinks.html
RefDesk.com
http://refdesk.com/
Webfile.com
http://webfile.com/
Where to Do Research
http://www.wheretodoresearch.com/

Directorios anotados
 AcademicInfo
http://www.academicinfo.net/
Resource Discovery Network
http://www.rdn.ac.uk/

Directorios de bases de datos
WebData.com
http://www.webdata.com/
Guías About
http://www.about.com/
LibrarySpot
http://www.libraryspot.com/
Motores avanzados Deep Query Manager (sustituye a Lexibot)
http://brightplanet.com/news/dqm2.asp

Estrategias y mecanismos de búsqueda en la web invisible
FeedPoint
http://www.quigo.com/feedpoint.htm
Search4science
http://www.search4science.com/
Strategic Finder
http://www.strategicfinder.com/

Bilbliografía

Jiménez, P. M. M. Estrategias y mecanismos de búsqueda en la web invisible. Disponible en Internet en http://biblio. colmex. mx/recelec/web_invisible. htm.

León, R. R., & Perojo, K. R. (2006). El Web como sistema de información.Revista Cubana de Información en Ciencias de la Salud, 14(1), 7.

No hay comentarios:

Publicar un comentario