giovedì 15 novembre 2007

I Microformati ed il Web Semantico

Come accennato in un mio post precedente, in cui ho trattato come argomento l'utilizzo delle licenze Creative Commons, eccomi quì adesso ad approfondire il discorso su che cosa sono i microformati e perché sono ritenuti così importanti, tanto che nella terza versione di FireFox verrà incluso un visualizzatore proprio per renderli facilmente consultabili.
La scrittura di questo post è stata davvero difficile, la voglia di informare anche chi non è un addetto ai lavori ha vinto rispetto all'irrefrenabile voglia di espletare interamente la tecnologia, reindirizzando a spazi più adeguati i più smaliziati tra di voi che vogliono approfondire questo argomento.

Che cosa sono i Microformati?

I microformati (o microformats) sono informazioni pubblicate in una porzione di codice, create in un particolare formato XML ed immerse (embedded) nella pagina HTML (o meglio XHTML) servita al browser. Il principale obiettivo di questi dati è quello di pubblicare informazioni, che possono anche non essere visualizzate come contenuto sulla pagina, ma sono considerate meta-informazioni (o metadati) interrogabili da remoto.

Attualmente esistono opportuni plugin, ad esempio se utilizzate FireFox, potete installare Operator o Tails Export, con cui è possibile visualizzare tutte le informazioni pubblicate con microformati presenti nella pagina che si sta consultando.

Inoltre con Operator vengono anche classificati in modo opportuno in diverse categorie di informazione: indirizzi, contatti, eventi, percorsi, tag, segnalibri e risorse.

Se provate ad utilizzarli quì su Open4Blog, troverete che Tails Export troverà la presenza di due microformati: uno relativo al mio contatto ed uno relativo alla licenza Creative Commons; mentre Operator renderà disponibili anche le informazioni dei tag dei post.
Possiamo classificare l'utilizzo dei microformati principalmente per due scopi: il semplice Data Web ed il Web Semantico.

Data Web

Le meta-informazioni sono interrogabili direttamente, in modo simile alle informazioni presenti in un database, questa particolare modalità di interrogazione è alla base di ciò che sarà il Web 3.0 ed è nota come Data Web.
L'attuale interesse verso i microformati è essenzialmente basato su questa importante caratteristica: trasformare qualsiasi informazione pubblicata sul web in risorsa reperibile direttamente da remoto, proprio come se fosse immersa in un infinito database gestito da tutti gli utenti.

Web Semantico = Data Web = Web 3.0 ?

Proprio in questi giorni si sta contribuendo a definire cosa sia esattamente il Web 3.0, l'opinione più accreditata sembrerebbe essere quella che avvicina la definizione di Web 3.0 con la definizione di Web Semantico.
Il Web Semantico si serve del Data Web, e quindi dei microformati, per poter interrogare i dati su tutta la rete ma con un particolare ponte di metadati: GRRDL (
Gleaning Resource Descriptions from Dialects of Languages).
Al contrario del Data Web puro, in questo caso i metadati non sono informazioni relative al contenuto in senso stretto, ma sono informazioni che riguardano la semantica del contenuto.
Ringrazio Simone Onofri, che dopo uno scambio di messaggi nella Semantic Web Italian Community mi ha reso disponibile un' eccezionale sintesi di tutto il meccanismo di conversione semantica:

Microformats -> GRDDL [XSLT] -> Web Semantico

Brian Suda e Dan Connolly hanno scritto le prime trasformazioni XSLT per l'estrazione di RDF da microformati. In questo momento altre persone si stanno occupando delle trasformazioni in RDF di altri formati.
Grazie all'interpretazione dei dati presenti nei microformati è possibile dare semantica, inserendo opportuni attributi o asserzioni in triplette: soggetto, predicato e valore.
E' quindi possibile caratterizzare con alcune asserzioni il significato associabile ad un contenuto pubblicato su web, potendolo interrogare e relazionare ad altri contenuti.

Ontologie

Per poter riuscire a far colloquiare tutti i sistemi per l'estrazione dei dati semantici vengono pubblicate le mappe di vocaboli di un determinato dominio di interesse, ontologie appunto, eccovi alcune delle più importanti che è possibile utilizzare adesso:

-RDF (Resource Description Framework): linguaggio di rappresentazione di una ontologia

-RDFS (RDF Schema): linguaggio di ontologia basato su RDF

-DAML+OIL: linguaggio di ontologia orientato agli oggetti (Object Oriented)

-OWL (Web Ontology Language): basato su DAML+OIL, è possibile definire ontologie web-based con maggiore applicazioni descrittive, ad esempio portali web e ricerche su contenuti.
OWL utilizza URI per nominare ed embeddare RDF, in questo modo è possibile aggiungere alcune capacità alle ontologie dando maggiore granularità e scalabilità.

Nessun commento: