Che cos'è il Data discovery
Una delle attività più importanti incluse nel grande universo della Business Intelligence è il cosiddetto Data discovery, o esplorazione dati. Consiste nel poter navigare, in maniera visiva, i dati forniti dal modello d’analisi con lo scopo di individuare trend, pattern e anomalie. L’attività è orientata all’utente di business, in quanto lui – e non l’IT – ha la conoscenza necessaria per comprendere a fondo i dati che sta navigando. Per far ciò, è ovviamente necessario che l’utente di business sia a conoscenza della struttura del modello d’analisi, e l’abbia compresa.
Il flusso operativo e lo Stack BI
Il data discovery non dovrebbe essere un’attività fine a se stessa. Benché sia comunque utile anche quando considerata da sola, essa acquista visibilità e potenza nel momento in cui è inserita all’interno di un flusso operativo che connette fra loro altre attività: il testing dell’infrastruttura BI da un lato, e l’abbozzo di report istituzionali e dashboard d’analisi dall’altra. Nello stack BI di Microsoft, le tre attività di testing, data discovery e draft design possono essere condotte per mezzo di Excel.
La fase di testing
Il testing parte dal presupposto che sia il business ad incaricarsi dell’attività di validare quanto è stato implementato dall’IT, e quindi analizzare e segnalare eventuali errori commessi, ovvero render noto cosa c’è di sbagliato nel modello d’analisi e qual è la causa. Il data discovery a scopo validativo va sfruttato anche in fasi successive al rilascio: col crescere del business (e dai dati), potrebbe essere interessante indagare su potenziali nuovi andamenti o fenomeni, e questo non esclude che subentrino dai sistemi sorgenti nuovi valori, inaspettati in fase di analisi preliminare.
Il punto di partenza
Molte aziende partano dal reporting/dashboarding come obiettivo di riferimento per il proprio progetto di Business Intelligence. Sconsiglio sempre questo metodo per varie ragioni: rischia di condizionare la modellazione dei dati su quello che è l’obiettivo di reporting, sposta il testing dagli strumenti di analisi a quelli di presentazione (SSRS, Power BI), ed infine bypassa l’attività di data discovery. Il Data discovery di sua natura è lo strumento perfetto come abbozzatore di quelli che saranno futuri report e dashboard. Utilizzando Excel, per esempio, è possibile creare tabelle pivot e grafici di vario genere connessi ai dati dei modelli d’analisi. Stiamo parlando di creare bozze di report e dashboard, bozze che possono essere create in autonomia dal business e poi consegnate all’IT per una più efficace ed istituzionale implementazione grafica.
L'importanza del Data discovery
Queste sono due ragioni del perché il Data discovery sia un’attività di Business Intelligence così importante. Di per sé, è lo strumento con cui il business può attivamente indagare i dati al fine di delineare andamenti congeniti ed individuare fenomeni anomali. Ma è anche uno strumento adatto a condurre attività quali il testing e la validazione del data warehouse, ed è pure uno strumento comodo e veloce per disegnare bozze di report e dashboard che andranno a comporre ed arricchire lo strato di presentazione delle informazioni della Business Intelligence aziendale.
di Thomas Tolio, pubblicato il 17 marzo 2021