Un’introduzione al Semantic Web: un motore di ricerca semantico.

Posted on 29 ottobre 2010

1


Terza e ultima puntata della mia introduzione al Web semantico (la sola seconda parte qui).
Oggi cerchiamo di capire su cosa si basa un motore di ricerca semantico.

Una ricerca semantica restituisce risultati sulla base della somiglianza semantica tra le parole (http://en.wikipedia.org/wiki/Semantic_similarity), ovvero considerando solamente quelle relazioni semantiche che abbiamo visto ieri e che esprimono una somiglianza (eliminando quindi per esempio antonimia o meronimia).

Se una ricerca per parola chiave restituisce “quei documenti che contengono la parola cercata“, la ricerca semantica restituisce “quei documenti che contengono le parole che sono in relazione di significato rispetto alla parola cercata“.

Per identificare relazioni di somiglianza tra parole o tra documenti si possono utilizzare

Ieri abbiamo visto metodi per la rappresentazione delle relazioni semantiche che coprono tutti e tre i paradigmi.
Un sistema molto veloce per estrarre in automatico le correlazioni semantiche da un corpus di testi è quello di studiarne le occorrenze di parole e di contesti testuali (http://en.wikipedia.org/wiki/Co-occurrence). L’ipotesi distribuzionale (http://en.wikipedia.org/wiki/Distributional_hypothesis) presuppone difatti che le parole che appaiono nello stesso contesto tendono ad avere relazioni di significato.

In questo modo è possibile realizzare una ricerca semantica che restituisca “quei documenti che contengono quelle parole/frasi che più spesso occorrono in documenti che contengono la parola cercata“. Un simile approccio può essere automatizzato e non richiede quindi la stesura di ontologie o altri strumenti di analisi che sono molto dispendiosi.

Advertisements