Un’introduzione al Semantic Web in tre puntate.

Posted on 27 ottobre 2010

4


Comincio oggi una “tre giorni” dedicata al Web semantico.
Per rispolverare una breve storia del Web potete rileggervi l’articolo su come siamo arrivati al Web Semantico.

Il Web semantico è un insieme di tecnologie che si pongono come scopo quello di permettere ad una macchina di interpretare un documento online basandosi sul suo significato.

Questo implica innanzitutto che i documenti pubblicati sul Web sono e restano dedicati agli esseri umani, mentre i metodi e le tecnologie del Web Semantico sono dedicate a strumenti software. Le due cose dovranno intrecciarsi in modo da non intralciarsi l’un l’altro.

Quando cercate sul Web il prezzo di un viaggio in Nuova Zelanda, per esempio, eseguite in modo naturale alcune operazioni di interpretazione di ciò che trovate scritto. Leggendo un certo numero capite che si tratta di una data, leggendo un altro numero capite che si tratta di un prezzo… E quelle due città (caratteri alfabetici altrimenti privi di significato, per una macchina) indicano rispettivamente l’aereoporto di partenza e l’aereoporto di arrivo.
L’uomo lo fa in modo naturale: e quindi finora sul Web non c’è stato bisogno di specificare che “Auckland” è il nome di una città e che “1.200” è il costo di un viaggio fino a lì, espresso in Euro, valido a determinate condizioni. Una pagina Web, se anche è leggibile da un essere umano, è pressoché incomprensibile per un software, che non ne “capisce” il “significato”.

Se però volete scrivere uno strumento software che permetta agli utenti di confrontare tra di loro i prezzi di tutte le offerte turistiche online che abbiano per meta la Nuova Zelanda, avete bisogno di spiegare al vostro software come identificare in giro per il Web i prezzi, le mete e tutte quelle deduzioni che l’uomo pesca dal proprio cervello e che sulla pagina, invece, non ci sono.

Questa è una delle applicazioni del Web semantico: l’estrazione (automatica) di un significato da una pagina. L’altra applicazione è il confronto tra significati “simili” (nel qual caso i metadati non sono solo descrittivi, ma sono ricchi di costrutti logici capaci di agevolare una serie di deduzioni automatiche).
Per riassumere: il paradigma del Web Semantico è quello di strutturare il testo di una pagina in modo da permettere a programmi software la ricerca, la correlazione e la valutazione dei significati espressi tramite il testo stesso.

E con questo arriviamo al significato di “significato”. I linguisti dicono che il significato è una porzione di realtà (anche astratta) resa tramite una o più espressioni linguistiche (il significante). Ovvero, il significato è ciò cui pensate quando leggete alcuni caratteri alfanumerici e “li capite”.
Cacca. Visto? Funziona.

Ecco, questa è una cosa che le macchine solitamente non fanno. Si fermano al significante e non ci trovano nulla “dietro”: esse non conoscono la porzione di realtà cui il significante si riferisce. Quindi il Web semantico ha, come prima priorità, quella di descrivere la realtà ad una macchina (e per questo si parla di descrizione formale), così che questa possa adeguatamente “incasellare” ogni parola e conseguentemente strutturare tutto il testo e ciò che esprime.

Finita l’introduzione all’introduzione. Domani facciamo sul serio.

Advertisements