NPO Sistemi Dati non strutturati?

Lavoriamoci con gli Insight Engines!

L'attuale stato dell'arte dell'evoluzione tecnologica ci pone di fronte all'esigenza e all'opportunità di trarre valore da tutte le sorgenti dati presenti in azienda. Non si tratta soltanto di quelle tradizionali contenute nei sistemi legacy, ma di tutto ciò che deriva dall'utilizzo dei canali social, dai documenti, dalle immagini etc.

Tutto ciò naturalmente ha come diretta conseguenza un aumento significativo, in taluni casi anche esponenziale, della quantità di dati da gestire per ottenere il valore rappresentato dalle informazioni in essi contenuto e dalla conoscenza che ne deriva.

Abbiamo tutti sentito parlare di Big Data, ma cosa sono esattamente? 

Per entrare più nel dettaglio è necessario prendere in considerazione tre elementi principali, le famose tre V:

  • Volume
  • Velocità
  • Varietà

a cui, data la complessità del tema, se ne sono aggiunte altre due:

  • Valore
  • Veracità (Veracity)

con lo scopo di individuare il valore insito nei dati e nelle loro correlazioni, in funzione dell'attendibilità delle sorgenti dati utilizzate.

Per quanto riguarda il Volume e la Velocità, la partita si gioca principalmente sul campo dei processi di raccolta e gestione dell'archiviazione. Rispetto alla Varietà, invece, ci si riferisce in particolare a due tipologie di dati:

  • Strutturati
  • Non Strutturati

Per i dati strutturati abbiamo a disposizione centinaia di tecniche per l'estrazione, la raccolta e l'organizzazione per la successiva analisi e trasformazione in informazione e conoscenza.

I dati non strutturati come video, documenti, fogli di calcolo, presentazioni, email, testi, immagini, pagine web, post su social network etc, si stima che rappresentino tra il 70 e l'80% (cit. wikipedia) dei dati aziendali e che abbiano una Velocità di crescita di molto superiore a quella dei dati strutturati contenuti nei sistemi legacy aziendali.

Ma allora, come utilizzarli al meglio?

Poiché i dati non strutturati risiedono sulle reti aziendali, all'interno di strumenti di collaborazione e in cloud, eseguire delle interrogazioni per individuare dei contenuti può essere un'operazione estremamente complessa. Per riuscire a classificare ed ordinare correttamente queste informazioni è necessario predisporre specifici processi che permettano di implementare una ricerca non più basata su parole chiave e contesti, ma sulla semantica dei contenuti.

Per ottenere un'efficace analisi dei dati che permetta di combinare dati strutturati e non strutturati, ci sono due aspetti principali di cui tener conto: l'infrastruttura e l'unificazione.

Ma come ottenerle?

Per far fronte alle esigenze di infrastruttura si ricorre spesso ad architetture disponibili sui principali cloud provider oppure a sistemi di Data-Lake. Per l'unificazione, invece, le cose si complicano proprio per via della Varietà dei dati non strutturati. La maggiore flessibilità offerta dai sistemi di Data-Lake non risolve il problema dell'unificazione che viene rimandato dalla fase di ingestion a quella di utilizzo dei dati.

Una possibile soluzione a queste criticità consiste nell'utilizzare una combinazione di tecniche di Cognitive Search, Natural Language Processing e Machine Learning per la realizzazione di Data-Warehouse Logici. Questa tecnologia rappresenta la chiave per l'unificazione dei dati provenienti dalle fonti più disparate ed è chiamata Insight Engines.

Infine, un altro aspetto essenziale, che si affianca all'unificazione per la trasformazione dei dati in informazioni, è la contestualizzazione. Anche per questo aspetto si ricorre all'utilizzo delle stesse tecniche di analisi semantica necessarie per estrarre il significato dal testo o dai dati non strutturati.

Riassumendo, possiamo certamente sostenere con forza l'esigenza e l'opportunità di assorbire il valore dei dati non strutturati all'interno della maggior parte dei processi di analisi e misurazione delle attività di business. Dobbiamo tuttavia scegliere con attenzione i processi, gli approcci tecnologici, gli strumenti coinvolti durante il percorso di trasformazione dei dati in informazioni, fino alla successiva evoluzione in conoscenza, che rappresenta il vero asset strategico al servizio delle aziende.

 

TIENITI AGGIORNATO

TIENITI AGGIORNATO

SEGUICI SU:

linkedin google

ACCEDI AI SERVIZI NPO

ACCEDI AI SERVIZI NPO