4 milioni di voci multimediali contro i 2,5 milioni di Wikipedia nella versione inglese. Sono questi i numeri da capogiro che presenta Freebase già dalla sua fase alfa. Come si è riusciti a far questo? Integrando il lavoro di uomini e donne che volontariamente inseriscono contenuti e procedono alla creazione di paths folksonomici con il lavoro di algoritmi che scannerizzano la rete e pescano contenuti standardizzando i formati. I risultati saranno attendibili? Si riuscirà ad avvicinarsi di più al "significato" delle cose, nascosto all'interno dei files multimediali e imprigionato dalle applicazioni proprietarie? E' un pò presto per saperlo, ma Freebase merita una possibilità per il solo fatto di averci provato. Gli utenti (umani) non solo fanno la loro parte ma direi che sono messi al centro del processo di generazione dei contenuti potendo proporre nuovi temi e integrare dati in ogni forma possibile. L'aspetto sociale è molto valorizzato e non potrebbe essere diversamente dopo l’avvento e lo sviluppo delle piattaforme wiki.
Da curiosi inguaribili abbiamo messo subito alla prova freebase su domandine "difficili" come Semantic Web, Multichannel marketing, folksonomy. I risultati sono (a nostro parere) buoni.
Ogni programmatore, sviluppatore, responsabile IT di questo mondo vorrebbe poter disporre di una banca dati comune in cui l'organizzazione e la classificazione delle informazioni avviene sulla base di unità di significato piuttosto che sulla base di formati e codifiche stratificate. Il social tagging ha dato un impulso in questa direzione rendendo "disponibili" ai motori di ricerca le informazioni sui contenuti di immagini, suoni e video sulla base di un immenso lavoro di descrizione effettuato dai generatori di contenuti. Anche il social networking si è mosso in questa direzione permettendo l'affiancamento delle informazioni nei formati classici con tag editabili, votabili e quindi "dinamici". Ma un vero web semantico è un'altra cosa. Si basa su un linguaggio in grado di gestire in differentemente qualsiasi tipo di informazione e da qualsiasi fonte essa provenga sulla base del "significato".
Ad oggi non disponiamo di una killer application in grado di far questo e quindi le informazioni restano imprigionate all'interno delle applicazioni anzicchè transitarvi solamente. Un'altra conseguenza è che molte informazioni "preziose" non sono disponibili operativamente perchè la loro "decodifica semantica" richiederebbe sforzi superiori al valore dell'informazione stessa. A mio parere siamo ad punto di svolta. Dovremo accettare prima o poi un web a due velocità in cui i contenuti generati semanticamente in forma nativa saranno più disponibili, più economici e più completi di quelli da "decodificare". Questo fino a quando i miliardi di terabites generati fino ad oggi saranno solo un bruscolino dello sterminato iperspazio della rete. Come si rapporta il marketing con questi cambiamenti? Quali opportunità e quali rischi sono collegati a questi cambiamenti? Al momento le risorse già disponibili sono tante ma completamente ignorate dai responsabili della business intelligence. Legati a vecchi tecniche di data mining e ancor peggio a improvvisazione pura, la maggior parte dei Marketing managers ignorano completamente la grande risorsa di informazioni contenute in cuei piccoli tag che milioni di utenti incollano ogni giorno ai loro post, articoli, video etc. Le tecniche di search engine optimization sembrano al momento le uniche opportunità di business che il marketing possa ricavare dal web semantico!!! Ma questa è una visione cieca e becera! Ricordiamo che le informazioni sono risorse preziose in azienda, come lo sono i contatti personali ( e le informazioni relative a questi contatti) ed il tempo. Semplificare qualcosa significa creare valore. Permettere il risparmio di tempo attraverso l'ottimizzazione dei processi significa generare valore. Il marketing semantico permetterà di far tutto questo restando proprietari delle informazioni generate che non saranno più prigioniere di API e mush-up che oggi ci sono e scompaiono da un giorno all'altro con la preziosa memoria in esse contenuta.
Il blog di Matteo Brunati Casual.info in.a.bottle è una risorsa imperdibile per chi vuole saperne di più sull'argomento.
Anche questa serie di slides è molto ricca di informazioni..