La web invisible o profunda

Hem de tenir present que no podem accedir sempre a tota la informació que hi ha a la xarxa. La web és una xarxa molt complexa i hi ha informacions de molts tipus. No tota la informació està indexada de la mateixa manera i n’hi ha una gran quantitat a la qual els motors de cerca no poden accedir.

De fet hi ha el que s’anomenen pàgines estàtiques i pàgines dinàmiques. Aquestes segones configuren la part més important, pel que fa al volum, de la web. Són pagines no fixes i que als motors de cerca els és molt difícil l’accés, per això s’han anomenat “invisibles” o la part “profunda” de la web. Els cercadors no poden “atrapar” aquestes informacions pels mètodes habituals, perquè no són pàgines editades en HTML. Tal com es mostra en la metàfora de la il·lustració: els hams de les xarxes de pesca no poden arribar a la profunditat marina i per tant hi ha peixos que s’escapen d’aquestes xarxes.

S’ha estimat que el contingut d’aquesta web profunda és 500 vegades més gran que la de la web estàtica. Hi ha bases de dades accessibles a través de la web. Es tracta d’informació estructurada en taules de dades creades i gestionades amb programes com: Access, Oracle, SLQServer, MySql, només accessible a través d’una àrea especial del lloc (de vegades és gratuït i de vegades de pagament). També hi ha bases de dades d’empreses, organismes, institucions, que poden tenir la forma de bases de dades de suport a la gestió. Poden ser també catàlegs per a clients o dades bibliogràfiques sobre temes especialitzats, biblioteques virtuals d’universitats i centres d’estudis, i un conjunt d’arxius “no textuals”, és a dir, arxius multimèdia, gràfics, software i documents en PDF. Alguns d’aquests sí que poden ser accessibles amb alguns motors de cerca.

Així doncs, el que cal tenir present és que quan cerquem alguna d’aquestes informacions ens hem de plantejar una altra estratègia d’accés.

Què hi ha a la web profunda?

Com es pot accedir a la web profunda?

Es pot recórrer a directoris temàtics que enllacin a llocs on hi hagi bases de dades. Per exemple, http://newslink.org/ és una base de dades que enllaça amb webs de tot el món.

Un altre servei que dóna referències de milers de llocs, que són invisibles per als motors de cerca és http://www.completeplanet.com.


Hypertext Markup Language: és el llenguatge utilitzat per crear pàgines web i en la xarxa d’Internet.

“Portable Document Format”. Es tracta d’un format estàndard de documents digitalitzats que es poden consultar amb una aplicació d’Acrobat.