Il web semantico

Posted on 29 ottobre 2007

1


Riporto alcuni estratti da un articolo molto interessante

“Le informazioni presenti in una pagina web, pur essendo formalizzate da organismi affidabili e universali come il W3C, riguardano solo l’aspetto dei dati mostrati, non il loro significato.Gli esseri umani sono abituati a cogliere il significato dall’aspetto (riconosciamo automaticamente un titolo, una data, ecc.), ma le macchine (software o hardware) non sono in grado di farlo, se non in casi particolari, quindi moltissime informazioni non possono essere correttamente rielaborate e sfruttate.Per risolvere il problema, si suggerisce di descrivere i dati con tag “parlanti”, come avviene, per esempio, nei feed RSS.Uno dei vantaggi di trasformare una pagina in un feed è anche quello di eliminare tutte le informazioni inutili, lasciando solo quelle significative (eliminazione del rumore di fondo). ….

“La soluzione parrebbe quindi quella di integrare nell’html le informazioni “semantiche”, ossia l’indicazione di quale tag sia un titolo, ecc. (un po’ come fa Google, che assegna significati semantici ai tag – es. h1=titolo – per meglio indicizzare i contenuti).Per questo sono stati proposti diversi metodi, tipo microformats oppure RDFa, secondo regole proposte da diversi enti, ma il fatto è che le tipologie dei dati ed il loro significato hanno una varietà tale da rendere vano qualunque tipo di classificazione “dall’alto”.Inoltre queste classificazioni riguardano solo le informazioni evidenti e non le eventuali relazioni occulte tra i dati mostrati, che possono essere estratte solo con una successiva fase di “data mining”.Ecco quindi che nasce l’idea della classificazione “dal basso”, ovvero prodotta dall’intelligenza di gruppo degli utenti, in grado di catturare tanto le informazioni evidenti quanto quelle nascoste.”

Posted in: web semantico