Web profund

De Viquipèdia
Salta a: navegació, cerca

El web profund[1] és tot aquell contingut de la xarxa que no forma part de l'Internet superficial, és a dir, de les pàgines indexades pels motors de cerca de la xarxa. Aquest fet es deu a les limitacions que té la xarxa per accedir a totes les pàgines web. És, doncs, la impossibilitat dels motors de cerca de trobar o indexar gran part de la informació que hi ha a Internet.[2]

Concepte[modifica | modifica el codi]

Michael Bergman va ser la primera persona a referir-se al terme deep web. A l'inici, però, ho va fer amb el concepte Internet invisible. El 2001, va publicar un article Web Profunda: sacando a la luz un valor escondido,[3] on explicava el significat del terme i exposava algunes característiques:[4]

  • Aleshores, el contingut de el web profund era d'entre 400 i 550 vegades més gran que la web superficial.
  • 60 dels portals més grans de el web profund contenen, en conjunt, al voltant de 750 terabytes d'informació, suficients per superar la mida de la web superficial en 40 vegades.
  • El contingut de el web profund és rellevant pel que fa a les necessitats d'informació, mercat i domini d'Internet.

Causes[modifica | modifica el codi]

No hi ha una xifra exacta de tota la informació que hi ha darrere la xarxa, però es creu que és 500 vegades superior a la que hi ha per davant, i a la qual tenim accés. Alguns dels motius pels quals el cercadors no són capaços d'indexar la informació de el web profund són:

  • Llocs web protegits amb contrasenya.
  • Documents en formats no indexables.
  • Enciclopèdies, diccionaris o revistes en les que per accedir a la informació es necessita interrogar a la base de dades, com per exemple, la de la RAE.[5]

Mida[modifica | modifica el codi]

el web profund és la informació que més creix a la xarxa, i més de la meitat del seu contingut està en bases de dades. La seva qualitat és considerada 1.000 o 2.000 vegades més gran que la de la web superficial, i el 95% de la informació de el web profund és informació pública i lliure de subscripcions i tarifes.

Estimacions basades en un estudi de la Universitat de Califòrnia a Berkeley especulen que actualment en el web profund hi deu haver uns 91.000 terabytes.[6]

Nivells[modifica | modifica el codi]

Per estructurar una mica tota la xarxa, està dividida en nivells, del 0 al 6:

El nivell 0 és la "Surface Internet", on l'usuari pot accedir a través del navegador estàndard i troba pàgines com per exemple Google, YouTube, Facebook, Twitter, Wikipedia... La majoria d'usuaris es mouen per aquest nivell.

El nivell 1 segueix sent "Surface Web” però hi ha llocs web menys coneguts però de fàcil accés, relacionats sobretot amb continguts no aptes per a menors.

El nivell 2 encara no és web profund, però hi ha dominis que es troben a través de buscadors independents, ja que no estan indexades en els buscadors estàndards.

El nivell 3 ja és web profund. A partir d'aquests nivells fan falta certes eines per aconseguir ser anònim, com per exemple TOR. Generalment, a l'hora de navegar per aquest nivell l'usuari s'ha de saber els URL o IP, ja que aquestes no són conegudes i només poden ser accedides si un les troba o per invitació. Els dominis d'aquest nivell estan composts per caràcters aleatoris. A les pàgines web no hi ha publicitat ni colors i es pot trobar des de pel·lícules i llibres que ja no estan a la superfície, fins a pornografia infantil, mercats de drogues i armes d'entre altres.

El nivell 4 està definit a alguns portals web com a molt perillós i alguns inclús diuen que als nivells anteriors s'hi pot accedir sense gaires problemes amb un bon proxy i detector d'intrusos, però en aquest nivell no és suficient. Es comenta que està plagat de hackers, veritables pirates informàtics relacionats amb robatoris i malversació de dades. A més a més, s'hi poden trobar pàgines fortament encriptades dels governs, des d'on es creu que podrien haver sortit alguns dels documents que s'han filtrat els últims temps. També s’hi poden trobar coses tant macabres com expedients de possibles experiments humans de les últimes quatre dècades.

Finalment hi ha els nivells 5 i 6 però no hi ha suficient informació per la xarxa. Alguns parlen que són secrets militars i que només hi poden accedir usuaris amb els coneixements suficients degut als complicats algorismes de xifrat que s'utilitzen.

Qui l'utilitza?[modifica | modifica el codi]

El web profund pot ser utilitzada per cometre activitats delictives, de manera que la seva adreça IP no és rastrejable i no es pot descobrir la seva localització física. Així també persones que volen protegir les seves comunicacions del govern, o reveladors d'informació que volen compartir grans quantitats d'informació interna a un periodista sense deixar rastre. Dissidents de règims estrictes que necessiten l'anonimat si volen estar segurs i donar a conèixer al món el que està passant veritablement al seu país.

A més a més, hi hauria institucions governamentals o grans empreses i multinacionals que volen guardar la seva informació i dades sense que ningú pugui accedir-hi. I per tant, també hi haurà hackers especialitzats a robar informació "Top Secret" per poder vendre-la a la competència, per exemple.

Com accedir a el web profund[modifica | modifica el codi]

Xarxa Tor

Tot i que els motors de cerca tradicionals no arriben a el web profund, qualsevol usuari pot accedir-hi.[7]

S'hi ha d'accedir de manera anònima per seguretat. És per això que no es poden usar els navegadors normals, sinó d'especialitzats que permet als usuaris connectar-se a pàgines web de manera anònima, fent extremadament difícil per qualsevol poder rastrejar les activitats si l'usuari segueix els protocols proposats.

Hi ha diferents programes que et permet fer-ho, com ara Tor, I2P o Freenet.[8]

Vegeu també[modifica | modifica el codi]

Referències[modifica | modifica el codi]

A Wikimedia Commons hi ha contingut multimèdia relatiu a: Web profund Modifica l'enllaç a Wikidata
  1. «Web profund». Cercaterm. TERMCAT, Centre de Terminologia.
  2. Moreno Jiménez, Pilar María: Estrategias y mecanismos de búsqueda en la web invisible
  3. Web Profunda: sacando a la luz un valor escondido
  4. ¿Qué es la Internet invisible o la Internet profunda?, Colombia Digital.
  5. Webactual.org (13 d'abril de 2013). «El diccionario de la RAE pertenece a la internet invisible.».
  6. Michael Lesk (1997). «How much information is there in the world?».
  7. Navegar en la internet profunda; WIKIHOW.
  8. La internet profunda. Qué es? Cómo se accede?; CONTRAINFO, periodismo para pensar.