miercuri, 5 mai 2010

The invisible World Wide Web

Poate multi dintre voi nu ati auzit de Web-ul invizibil si nu prea stiti la ce se refera. Se mai cunoaste si ca Deep Web. Ei bine, este vorba despre acea parte a WWW inaccesibila motoarelor de cautare. Dupa cum stim, pentru a avea trafic pe un site, blog, ne propunem ca mai intai acesta sa fie indexat de motoarele de cautare, in special Google. Indexarea se face pe anumite criterii, de exemplu dupa taguri, care daca nu se gasesc si in text, crawlerii vor trece peste...stiti voi..ca niste paianjeni care scaneaza siteurile. Si ar mai fi ceva - multe baze de date ale bibliotecilor cer user si parola, deci nici acestea nu sunt luate in calcul. Ca sa intelegeti mai bine de ce va spun aceste lucruri ganditi-va cand ati avut nevoie de o informatie si pur si simplu nu a fost de gasit in aceasta mare de informatie. Si ca sa va imaginati exemplul, open web are numai 167 de terabiti, iar webul invizibil are 91.000 de terabiti!! Cam mare diferenta, nu-i asa? Biblioteca Congresului sustinea ca avea in anul 1997, aproape 3000 de terabiti. Din cauza aceasta s-au invetat tot felul de motoare de cautare utile si specializate pentru a cauta "in profunzimea netului". Printre acestea se numara: Infomine (http://infomine.ucr.edu/ ), construit de cateva biblioteci din SUA, the WWW Virtual Library (http://vlib.org/ ), Intute (http://www.intute.ac.uk/ ), Complete Planet , InfoPlease (http://www.infoplease.com/index.html ), DeepPeep (http://www.deeppeep.org/ ), Deep Web Tech (http://www.deepwebtech.com/ ) etc. Be smart!



Niciun comentariu:

Trimiteți un comentariu

Bookconsumer