Le imprese oggi hanno a disposizione una mole di dati impensabile fino a dieci anni fa. Ora possiamo sapere tutto sui nostri clienti, sui fornitori, sulla filiera e sui territori in cui le imprese operano. Molti di questi dati sono anche disponibili come open data, accessibili cioè da chiunque gratuitamente. Sulla carta le possibilità che si aprono con queste informazioni sono enormi ma spesso banali ostacoli tecnici e difficoltà gestionali limitano le possibilità di sfruttare queste informazioni per accrescere il business dell’azienda. Una prima semplice soluzione per abbattere tempi e costi di gestione delle proprie informazioni aziendali è l’utilizzo dei linked data, dati raccolti e salvati in modo intelligente, facilmente integrabili con altri sistemi di dati e spesso disponibili gratuitamente online su database istituzionali o di centri di ricerca no-profit.
Cosa sono i linked data?
La teorizzazione del concetto di linked data si deve a Tim Bernard Lee, il premio Nobel inventore del World Wide Web. I linked data sono fondamentalmente dei dati pensati per poter essere facilmente collegabili tra loro.
Pensiamo ad un’agenda: è come se nomi, numeri e indirizzi di una serie di contatti anziché essere schedati in ordine alfabetico in un taccuino fossero invece accatastati alla rinfusa annotati ciascuno su tanti coriandoli di carta. In questa situazione però ciascuno pezzo di carta - e cioè ciascun numero, ciascun indirizzo, ciascun nome – presenta informazioni aggiuntive che rinviano agli altri elementi ad esso collegati. Con un motore di ricerca posso quindi inserire il nome della persona di cui mi serve il numero di telefono e trovare subito facilmente nome e numero (così come avrei fatto anche con il taccuino-agenda), ma posso anche fare la ricerca inversa, partendo cioè dal numero di telefono, oppure ancora posso chiedere ed ottenere in pochi istanti la lista di tutti i numeri di telefono di quelle persone, tra i miei contatti, che abitano ad esempio a Milano a meno di 5km dalla stazione di Cadorna. Posso anche aggiungere in pochi istanti a quella lista di contatti iniziale una serie di indirizzi email che ho recuperato da un’altra agenda. Posso fare lo stesso con le date di compleanno, informazioni su statura e peso, preferenze musicali, squadra di calcio tifata e molto molto altro. Se si utilizzano i linked data le informazioni aggregabili sono pressochè infinite e, se si sfruttano gli open data, sono anche gratuite.
Tornando alla definizione, i linked data hanno quattro caratteristiche:
- sono spesso accessibili liberamente (hanno cioè una open license)
- sono raccolti e catalogati tramite un *resource description framework*, ovvero per ogni elemento, nome, indirizzo o numero che sia, viene indicato il modo attraverso cui quel dato può essere collegato ad altri dati inerenti, così da rendere più facile l’integrazione e il confronto tra tipi di dati diversi. Sono cioè *smart data.*
- Sono dotati di un Uniform Resource Identifier, ovvero ogni singolo elemento ha un suo codice identificativo univoco: si evitano così ridondanze e incongruenze
- Sono online (sono cioè accessibili tramite un protocollo http)
Come può un’azienda sfruttare i linked data?
Per capire come i linked data possono abbattere i tempi e i costi di gestione di un’impresa è utile iniziare con un esempio.
Immaginiamo un’azienda che produce prodotti alimentari, in particolare caseari. Questa azienda, chiamiamola “Bianchi Formaggi srl”, vende a grossisti attivi più o meno in tutta Italia. L’elenco dei suoi clienti con gli indirizzi di fatturazione è in una certa banca dati. In un’altra banca dati ha le informazioni sugli ordini di questi clienti, così da gestire la produzione. Poi c’è un terzo sistema di dati: si tratta di un’altra rubrica, questa volta con numeri di telefono e indirizzi email dei referenti commerciali di ciascun grossista. L’elenco dei prodotti, infine, con tutte le informazioni su costi, ingredienti e tempi di produzione è in un quarto sistema di dati in mano al reparto produttivo.
Bene, cosa succede ora se la Bianchi Formaggi vuole conoscere in dettaglio gli ordini dei suoi clienti in una determinata regione geografica, poniamo la Puglia, per sapere se promuovere una offerta speciale che aumenti la sua fetta di mercato su quel territorio? Dovrebbe integrare tutti questi dati: informazioni sugli ordini, indirizzi fisici dei grossisti e infine costi di produzione di ciascun articolo per meglio decidere quali prodotti scontare e di quanto. Potrebbe inoltre avere accesso ad open data accessibili gratuitamente presenti su un sito istituzionale della regione Puglia dove magari sono stati caricati i dati sull’afflusso turistico e sui consumi dei visistatori degli ultimi anni e le previsioni per l’anno in corso divise per provincia. In base a questi dati la Bianchi formaggi potrebbe avere una misura il più possibile esatta di quale potrebbe essere la domanda associata ai suoi grossisti delle province di Lecce, Taranto e Bari durante i mesi di luglio e agosto e abbattere così la quota di invenduto. Potrebbe inoltre decidere offerte speciali su quei prodotti che, grazie a dati fornitegli dai grossisti stessi e grazie agli open data trovati sul sito istituzionale della Regione, sa essere particolarmente richiesti dai turisti durante i mesi estivi, così da conquistare una più grossa fetta di mercato.
È chiaro: nella situazione descritta in partenza integrare tutte queste informazioni è impossibile, è un lavoro lungo e costoso, ma tutto risulta più semplice se questi dati sono accumulati nella forma di linked data in un unico database. Ancora meglio se i dati richiesti sono disponibili gratuitamente, online, presenti già nella forma di smart data da poter essere subito scaricati e integrati: sono i linked open data.
Diagramma di tutti i database di linked open data connessi a DBpedia
La soluzione per i linked open data
Molti non sanno che sempre più dati sono disponibili in forma di *open data online, gratis, su banche dati istituzionali come il portale dati europeo (che contiene informazioni su agricoltura, energia e trasporti), il portale dati dell’ISTAT o quello del governo italiano. Esistono anche portali generalisti come DBpedia, che contiene i dati contenuti in Wikipedia, e altri più specifici come Open Street Map, che contiene dati utili alla geolocalizzazione e georeferenziazione degli indirizzi. Come fare a cercare i dati che mi servono? Spesso questi portali non si conoscono. Spesso poi una stessa categoria di informazioni potrebbero essere presenti in più portali e avere lievi differenze (ad esempio i dati sull’afflusso turistico a Milano potrebbero essere contenuti sia sul portale ISTAT sia su quello della regione Lombardia con lievi divergenze numeriche), come faccio quindi ad avere sotto controllo, una volta che integro questi dati, anche la loro fonte così da poter decidere su quale fonte fare affidamento di volta in volta? La soluzione è usare uno strumento all’avanguardia: la soluzione arricchisci di linkeddata.center. “arricchisci” serve per scaricare dati da una qualsiasi fonte web, strutturarli e usarli insieme a quelli della tua azienda. Gli open data possono risultare utili ad esempio per il marketing (dati sui consumatori, sui prezzi, sui prodotti, sulle aziende), per le vendite (dati sui competitor, sui mercati), per la produzione (dati sui consumi, sul traffico). La soluzione arricchisci recupera automaticamente i dati utili e li struttura per essere poi uniti con quelli già disponibili. Inoltre la soluzione include una verifica della licenza d’uso dei dati estratti e ne identifica la fonte, così che tu possa scegliere ogni volta, in caso di conflittualità, su quali dati fare affidamento e se ti è possibile diffonderli a terzi oppure no.
La soluzione arricchisci usa la tecnica oggi più potente per gestire i dati e permette di:
- essere basata nativamente sullo standard di riferimento per la pubblicazione degli open data nel mondo (raccomandato dall’AGID);
- mantenere sotto controllo i dati estratti, tracciando la provenienza di ciascun singolo dato;
- assegnare un significato ai dati verificando in ogni momento la correttezza e coerenza dei dati con regole semantiche;
- adottare tecniche di machine learning per strutturare i dati non strutturati;
- ripetere e aggiornare l’estrazione in qualsiasi momento.
Si tratta al momento della migliore soluzione per gestire i dati aziendali nel modo più efficace ed efficiente possibile.
Per maggiori informazioni su questo prodotto, visita il seguente link: