Il Semantic Web

Posted on 12 maggio 2007

1


Fatta eccezione per i link, che stabiliscono una connessione diretta tra documenti, il modo migliore, ad oggi, per esplorare il web è rappresentato dall’utilizzo dei motori di ricerca, basati sulla tecnologia keyword search, che consentono ricerche effettuate mediante l’utilizzo di parole chiave attraverso le quali ottenere determinati documenti. Tuttavia, ci sono molti problemi associati al loro utilizzo:
• Alto numero di risultati restituiti, bassa precisione
Di solito le principali pagine pertinenti sono recuperate, ma esse sono di poco aiuto migliaia di altri documenti irrilevanti o di scarsa connessione con l’argomento richiesto vengono restituiti insieme ad esse.
• Basso numero di soluzioni o nessuna soluzione trovata
Spesso accade che le parole iniziali che utilizziamo per la ricerca dei documenti non danno nessun risultato oppure essi sono di scarsa pertinenza.
• I risultati ottenuti sono strettamente legati alle parole usate nella ricerca
Le parole utilizzate per trovare i documenti richiesti non danno i risultati che vorremmo, poiché nei documenti che cerchiamo ricorre una terminologia differente da quella utilizzata nella query. Query semanticamente simili, invece, dovrebbero restituire risultati analoghi.
• Le soluzioni restituite sono singole pagine web o singoli documenti.
La ricerca di informazioni su più documenti richiede l’utilizzo di molte query e successivamente l’estrazione e il collegamento “manuale “ da parte dell’utente.

Anche se le tecniche di ricerca basate sulle “keyword” vengono continuamente migliorate, rimangono due problemi di fondo:

1. L’utente deve trovare, tra i vari documenti restituiti dalle query, quelli strettamente collegati all’informazione che cercava, con grande spreco di risorse e di tempo.
2. La ricerca è basata sul confronto tra parole e non tiene conto del loro significato.

Il principale ostacolo nel fornire agli utenti un miglior supporto nelle loro ricerche, al momento, è rappresentato dalla struttura dei contenuti web che non è machine-accessible: il calcolatore non è in grado di interpretare il significato del documento e quindi restituire informazioni realmente utili per l’utente.
Un modo per risolvere questo problema è quello di rappresentare i contenuti del Web e dei documenti in una forma che sia facilmente machine-processable e di creare e usare tecniche che sfruttino questo tipo di rappresentazione.
Questo approccio prende il nome di Semantic Web.
Il Semantic Web è stato ideato dal World Wide Web Consortium (W3C).

La gestione della conoscenza riguarda l’acquisizione, l’accesso e il mantenimento delle informazioni all’interno di un’organizzazione. Infatti gestione e utilizzo corretto della conoscenza rappresentano, per un’azienda, una risorsa fondamentale da cui estrarre informazioni per migliorare la produttività, aumentare la propria competitività, generare valore attraverso l’innovazione.
Tuttavia le informazioni che si possono consultare hanno una struttura tale da rendere difficile la loro gestione. L’attuale tecnologia utilizzata nella gestione della conoscenza presenta restrizioni relative alle seguenti operazioni:

• Searching information: l’utilizzo di motori di ricerca keyworld search based per la ricerca di documenti presenta tutte le limitazioni descritte precedentemente;
• Extracting information: l’estrazione delle informazioni necessarie dai documenti ottenuti viene fatta dall’utente con grande spreco di risorse e di tempo;
• Maintaning information: l’impossibilità di valutare inconsistenze nella terminologia utilizzata e mancata rimozione di documenti ormai vecchi e/o non più validi.
• Viewing information: l’impossibilità del controllo di accesso a informazioni riservate. Mentre nei database comuni è possibile nascondere informazioni a chi non dispone delle autorizzazioni necessarie ad accedervi, l’applicazione di un controllo d’accesso in Intranet o Internet risulta, invece, difficilmente realizzabile.

Il Semantic Web permette di ottenere sistemi migliori e più avanzati nella gestione della conoscenza attraverso:

• L’organizzazione delle informazioni in spazi concettuali strettamente collegati al loro significato.
• Lo sviluppo di tools automatici che si occupano della manutenzione della conoscenza, effettuando controlli sulla presenza di possibili inconsistenze ed estraendo nuove informazioni.
• La sostituzione della Keyword search con la query answering (risposte a domande formulate usando il linguaggio naturale) che consentirà di cercare, estrarre e presentare la conoscenza richiesta in un formato comprensibile dall’uomo.
• Il supporto di query answering incrociate ed effettuate su più documenti; in tal caso, i contenuti richiesti dall’utente verrebbero trovati, estratti e collegati direttamente dalla macchina, con grande risparmio di tempo.
• L’implementazione di un sistema d’accesso controllato alle informazioni.

I vantaggi maggiori nell’utilizzo del Semantic Web si avranno nell’erogazione di servizi, ivi compreso l’e-commerce, grazie anche alla rivoluzione che esso consentirà nell’estrazione di informazioni pertinenti da knowledge base molto ampie, rispetto alle quali gestirà in maniera automatizzata anche l’eliminazione delle ridondanze, dei materiali obsoleti e ormai sostituiti da aggiornamenti, riducendo al minimo il problema del “garbage in-garbage out”.
Si avrà una decisiva evoluzione anche nell’ambito di quei servizi comparativi come kelkoo o trovaprezzi, oggi rigidamente limitati al confronto fra quei soli esercenti che pagano per essere inseriti nei loro database e sulla sola dimensione prezzo relativo a prodotti identici. Quando invece le tecnologie del web semantico consentiranno ricerche su tutto il web l’utente avrà piena libertà di trovare prodotti simili puntando sul significato delle loro descrizioni (oggi like.com basandosi su algoritmi di comparazione delle immagini è in grado di trovare oggetti aventi caratteristiche estetiche simili – forma, colore, ecc. – ma col solito limite legato all’adesione degli esercenti al proprio servizio).
Applicazioni importantissime saranno anche quelle consentite alla Pubblica Amministrazione, che potrà semplificare e rendere al contempo molto più efficienti ed efficaci i servizi offerti ai cittadini (consultazione direttive, norme, leggi, gazzette ufficiali, ecc.), nonché alla comunità scientifica che vedrà infinitamente potenziati i servizi attuali di ricerca di articlo e saggi pertinenti con l’oggetto della propria ricerca (esisto già semplici motori di ricerca basati sul reperimenti di articoli in cui viene citato un articolo/ricerca/autore indicato dall’utente).

Un utente che vuole effettuare acquisti su internet vorrà prima di tutto ottenere informazioni sui prezzi, sui termini di pagamento, sulla garanzie dei prodotti che intende comprare e magari, in seguito, conoscere le offerte dei maggiori negozi on-line. Questa ricerca al momento risulta essere però molto lunga e spesso priva di risultati.
Il Semantic Web permetterà di sviluppare degli agenti che saranno in grado di:

• Interpretare le informazioni relative a un determinato prodotto;
• Confrontare i prezzi e le caratteristiche dei prodotti presenti nei negozi on-line con quelle richieste dall’utente.
• Ricavare ulteriori conoscenze circa la reputazione del prodotto/negozio on-line (consultando anche recensioni su e-magazine, newgroup, blog e pagine personali di utenti che hanno già acquistato il prodotto o magari presso lo stesso e-shopper.
• Gestire direttamente le transazioni di acquisto al posto dell’utente;

Inoltre il Semantic Web permetterà di sostituire l’approccio EDI, (Eletronic Data Interchange) tradizionalmente usato nel B2B e molto difficile da implementare e integrare con altre applicazioni, con agenti in grado di effettuare gare d’appalto, negoziazioni e stipulazioni di contratti in maniera automatica.

Attualmente i contenuti web sono realizzati per essere interpretati dall’utente ma non dai programmi. Infatti il linguaggio utilizzato per la rappresentazione di contenuti web è l’HTML che, grazie all’utilizzo dei tag, permette di presentare i contenuti Web in un formato accattivante e facilmente interpretabile dall’utente, ma non altrettanto “comprensibile” alle macchine.
Invece, il linguaggio utilizzato dal Semantic Web dovrebbe permettere la generazione di pagine contenenti sia informazioni per la formattazione della pagina (necessarie per generare un documento leggibile dall’uomo) sia informazioni sui dati in esso contenuti (necessarie per generare un documento processabile dalla macchina).
Per esempio, attualmente una porzione di pagina web scritta in HTML potrebbe essere cosi rappresentata :
h1>Centro Odontoiatrico Lizzi Vicenzo
h2>Benvenuti nella nostra home page! Avete bisogno di otturazioni, sbiancatura dei denti o trattamenoi antitartaro? Ci prenderemo cura noi dei vostri denti
Il mio staff è costituito da :
Marcello Pelusi, che appronterà i vostri apparecchi dentali; Nicoletta Bocelli, la nostra infermiera tutto fare; Valentino Scarchilli nostro insostituibile segretario.
Riceviamo tutti i giorni dal lunedì al venerdì dalle ore 9 alle ore 18.
L’informazione così formulata è facilmente interpretabile da parte di un utente ma non da parte di una macchina. Per ottenere una rappresentazione che sia anche machine-processable si utilizzano i metadata, ossia informazioni relative ai dati rappresentati.
Una rappresentazione mediante i metadata potrebbe essere :

Centro di Odontoiatria e Implantologia di Lizzi Vincenzo
Otturazioni
trattamento antitartaro
sbiancatura denti

Lizzi Vincenzo
Marcello Pelusi
Nicoletta Bocelli

Le macchine potranno gestire questi dati con maggiore semplicità rispetto a quelli sopraelencati espressi in HTML. Infatti, sarà molto più semplice per la macchina distinguere, mediante l’utilizzo di questi innovativi tag, l’odontotecnico dall’infermiera, i vari trattamenti offerti e il tipo di studio medico.
Sarà possibile, così, restituire all’utente solo le informazioni relative, a esempio, ai trattamenti offerti dallo studio odontoiatrico o le informazioni relative allo staff.
L’utilizzo di una keyword-based search sul documento scritto in HTML permette, al contrario, di identificare i termini chiave usati nella ricerca, ma non è in grado di effettuare distinzioni tra chi sia l’odontotecnico e chi la segretaria: questo compito rimane a carico dell’utente che dovrà ricavare tali informazioni dalla lettura dell’intero documento restituito (o delle miglia di documenti restituiti!) con grande spreco di tempo.

Per chi volesse approfondire rimandiamo al sito ufficiale del World Wide Web Consrtium (http://www.w3.org/2001/sw), al report pubblicato a cura della Lifeboat Foundation (http://lifeboat.com/ex/minding.the.planet) e a un saggio recente di Nigel Shadbolt, Wendy Hall e Tim Berners-Lee (il papà del web).

Piero Scrisci

Messo il tag: , ,
Posted in: corso di crm