La gestione delle informazioni in una data-driven company con le DMP.
I dati sono il petrolio del futuro, ma come il petrolio devono essere raffinati prima di poter essere usati. Per accrescere la competitività di una impresa è necessario un sistema informativo che separi in modo chiaro il mondo dei dati dal mondo delle applicazioni.
I dati sono ovunque e non esiste un solo modo di trattarli: alcuni devono essere analizzati in tempo reale, altri possono essere analizzati con più calma. Pensate ad esempio un sistema di allarmistica o il sistema di indiciamento delle pagine web di google.
Spesso i dati devono essere puliti, trasformati e caricati in storage intermedi per poter essere analizzati. Il solo data wharehouse non è più sufficiente. Oggi è necessario utilizzare data lake per trattare anche i dati strutturati o no che arrivano da fonti diverse e integrare open data. Quando i dati sono tantissimi occorre aggregarli utilizzando tecnologie di big-data come quelle messe a disposizione da Apache hadoop.
Ancora più spesso, anche grazie ai nuovi algoritmi di machine learning le relazioni tra i dati diventano così complicate e profonde da richiedere di essere organizzate in una base della conoscenza, ad esempio utilizzando un knowledge graph. La conoscenza così ottenuta può essere anche navigata da algorimi di intelligenza artificiale, basati su reti neurali o su da regole logiche (Neuro-symbolic A.I.).
Una data management platform (DMP) è appunto l’insieme degli strumenti che consentono di pulire, federare, integrare e analizzare i dati provenienti da moltissime fonti, sia interne che esterne all’azienda. Grazie alle DMP le applicazioni accedono con un approccio unitario a tutti i dati disponibili, superando i limiti imposti da architetture in cui i dati sono posti in silos non comunicanti.
La piattaforma diventa smart nel momento in cui è in grado di comprendere anche il significato dei dati. Solo così è possibile collegare dati eterogenei garantendo nel contempo la crescita ordinata delle informazioni a supporto delle decisioni. Nella seguente figura, in arancione sono evidenziati i tipici componenti di una Smart Data Management Platform:
Anche il significato dei dati muta nel tempo, fortunatamente le tecnologie semantiche sviluppate nell’ultimo decennio nell’ambito del Semantic Web hanno hanno dimostrato di essere capaci di supportare anche i cambiamenti di modello di business più radicali.
I dati con un significato formale si sono guadagnati sul campo la qualifica di smart e sono oggi maturi per un impiego nei business come già fanno Google, FaceBook, IBM, governi e moltissime startup.
Le principali piattaforme di cloud (Amazon AWS, Google Cloud, Microsoft Azure, etc) mettono a disposizione un ricco insieme di strumenti in modalità “as a Service” per gestire i big data, i data lake e molti altri componenti della data management platform. LinkedData.Center si è specializzata negli strumenti di ingestion dei significati e di interfaccia verso gli smart data con il suo prodotto Smart Data as a Service (SDaaS)
Un esempio di implementazione completamente “as a Service” basata su strumenti disponibili sulla piattaforme Amazon AWS e LinkedData.Center è descritta nella seguente figura:
Con una smart data management platform è possibile analizzare i gusti e i comportamenti dei propri clienti per proporgli il miglior prodotto, identificare nuove aree di business, nuove tendenze, ottimizzare i costi e tutto quanto la fantasia dell’imprenditore suggerisce.
L’unico elemento imprescindibile sono i dati, siano essi aziendali (first party data), provenienti da partner (second party data) o da fonti esterne all’azienda (third party data) come ad esempio gli open data forniti gratuitamente dai governi o i dati a pagamento forniti da data providers.
Una buona smart data management platform è in grado di utilizzarli tutti, anche in presenza di inconsistenze differente qualità tra i dati trattati.