Come siamo arrivati al Web Semantico.

Posted on 8 giugno 2009

2


Il Web è ancora molto giovane, e la sua storia è una storia di costante evoluzione.

Nel 1989 l’inglese Timothy John Berners-Lee ideò, assieme al belga Robert Cailliau, un sistema per pubblicare e correlare tra di loro contenuti (testi documentali, per lo più), dove chiunque potesse aggiungere  al sistema altri contenuti ed eventuali correlazioni che da questi portano a quanto  già pubblicato. E’ la nascita del Web, la ragnatela delle informazioni, che dall’anno successivo si diffonde sempre più in tutto il mondo sfruttando quella connessione tra macchine che Internet stava contribuendo a creare.

Il Web di Tim Berners-Lee voleva quindi essere una raccolta di contenuti, una specie di enorme biblioteca, caratterizzata però da

  • relazioni tra informazioni (i link tra le pagine)
  • una distribuzione universale delle informazioni (la diffusione mondiale di cui ha presto goduto grazie a Internet)
  • una partecipazione universale alla crescita dell’insieme (la condivisione gratuita delle informazioni di cui si dispone)

Grazie all’idea di due uomini si è passati da una rete di macchine (Internet) ad una rete di informazioni espresse in pagine (il Web); eppure Tim Berners-Lee sognava di realizzare una rete di informazioni espresse in concetti.

Il risultato finale sarebbe dovuto essere un sistema con cui collegare tra di loro i dati e i pensieri, non le pagine che contenevano tali dati e tali pensieri. La relazione tra le informazioni si sarebbe dovuta evolvere dal link tra pagine al link tra concetti.

Così, dopo aver accompagnato i primi dieci anni di vita del Web, i suoi ideatori cominciarono a lavorare al Web Semantico più o meno agli inizi del 2001 (9 febbraio 2001: vedi anche la pagina Semantic Web Actvity Statement). L’idea era di costruire una struttura di collegamenti che fosse maggiormente espressiva di quella del semplice link: ogni dato, ogni parola sarebbe stata corredata di informazioni su ciò che quella parola esprimeva. Pesca. Già: ‘pesca’… in che senso? Abbiamo una parola, ce ne manca il significato. Occorreva ancorare ogni singola informazione ad uno schema che ne spiegasse il ruolo e il senso all’interno di una frase.

Ma far sì che una macchina abbia tutti gli strumenti per capire (meglio: possedere) il senso di una parola scritta è un lavoro lungo e complicato: occorre infilare nel testo tutte quelle informazioni che il lettore umano normalmente trova nel proprio cervello ma che una macchina ovviamente ignora. Le meta-informazioni.
Ma è un lavoro lungo. L’essere umano è pigro. E non solo: l’essere umano sa mentire. Ci vorrebbero strumenti che lo facciano da soli, oppure in maniera semi-automatica. E per ogni lingua… Oppure meglio: indipendentemente dalla lingua. Ci voleva del tempo.

Così nel frattempo qualcuno notò alcune caratteristiche che il Web stava assumendo per conto suo e cominciò a parlare di Web 2.0: un Web dove l’accento è posto sulla condivisione delle informazioni e sulla correlazione tra le persone. Wikipedia è un’enciclopedia dove chiunque può scrivere o correggere una voce; le piattaforme di blogging permettono a chiunque di scrivere ciò di cui sanno o desiderano parlare; Facebook è uno strumento con cui chiunque può mantenere intatti i rapporti interpersonali che ha istituito nel mondo reale.
‘Chiunque’ è la parola chiave.

Tim Berners-Lee non ha mai accettato la definizione di Web 2.0 poiché a suo avviso il Web è nato esattamente con quegli scopi: e se adesso è più semplice per ognuno di noi contribuire alla raccolta delle informazioni, questo è dato solamente dall’esistenza di prodotti e software che ne facilitano il compito.

Tuttavia anche Tim Berners-Lee dovette adeguarsi alla fortuna di quell’etichetta: decise così che il suo Web Semantico sarebbe stato il Web 3.0.
Come dice la già citata pagina di Wikipedia (e numerose altre pagine che ne riportano pedissequamente alcuni stralci)

[…] un ambiente dove i documenti pubblicati (pagine HTML, file, immagini, e così via) siano associati ad informazioni e dati (metadati) che ne specifichino il contesto semantico in un formato adatto all’interrogazione, all’interpretazione e, più in generale, all’elaborazione automatica.

Febbraio 2001. Sono passati più di otto anni: un sacco di tempo, di questi tempi. A che punto siamo? Vale la pena interessarsene, o stiamo parlando di un binario morto, di una tecnologia che non vedrà mai la luce a causa della sua stesa complessità? In otto anni siamo passati dai primi articoli sul Semantic Web (comunque utilissimi, per chi comincia) a centinaia di pagine pubblicate ogni mese sui blog: segno di un crescente interesse e di un crescente coinvolgimento degli sviluppatori.

Ma non solo: da qualche mese le tecnologie che stanno alla base della descrizione semantica delle informazioni vengono adottate da società leader nella ricerca sul Web per indicizzare in modo strutturato i documenti (cosa che si discosta dall’accento sulla deduzione automatica che Tim Berners Lee poneva sul proprio progetto, dove i metadati sono ricchi di costrutti logici).

Una prima società che adottò tecnologie del Web Semantico è stata Yahoo! per il suo motore di ricerca SearchMonkey; da poco ci si è aggiunto anche Google (come da articolo apparso il 12 maggio 2009): le sue “Rich Snippets” (per ora solo in inglese) si basano/baseranno difatti sullo standard “RDFa”, di cui potete trovare un’introduzione alla pagina http://google.com/support/webmasters/bin/answer.py?answer=146898&cbid=3w0mk0eti5hg&src=cb&lev=answer oppure, sul sito del Consorzio W3C, alla pagina http://www.w3.org/TR/xhtml-rdfa-primer/

Se siete interessati posso mandarvi una mia traduzione all’articolo sullo standard RDFa, tanto per capire di cosa si stia parlando. Se un gigante del calibro di Google si dedica al Web Semantico, consiglio tutti coloro che hanno a che fare con il Web di interessarsene.
Il Web è ancora molto giovane, e la sua storia è una storia di costante evoluzione. Datevi da fare.

:)