ETL e ELT: davvero c’è bisogno di parlarne ancora?

Datamaze
09.02.23 10:35 AM Comment(s)
Da tempo ormai si parla della differenza fra ETL e ELT, in modo da far comprendere alle aziende quale dei due strumenti conviene adottare in ambito di Business Intelligence per alimentare il proprio Data Warehouse. Mi correggo: gli articoli su questo tema spesso spiegano al pubblico perché dovrebbero abbandonare l’ETL e migrare all’ELT. In termini assoluti non se ne parla forse da così tanto; in termini relativi se ne parla da troppo, vista soprattutto la scarsa concretezza del dialogo. Ma facciamo un passo indietro.              
Entrambi sono acronimi per i termini Extract, Transform, e Load, ma con le iniziali ordinate diversamente fra loro:              

ETL = Extract, Transform & Load

ELT = Extract, Load & Transform

Differenze e caratteristiche

In molti si sono dilettati, anche di recente, a descrivere le motivazioni per la quale l’ELT sia migliore rispetto all’altro, tirando in causa i concetti di miglior utilizzo della memoria, maggiori prestazioni ed altri vantaggi prettamente tecnici. Fra queste persone ce ne sono parecchie che associano l’ELT al mondo dei Big Data, dei Data Lake e del Cloud Computing. Evidenziando le differenze col “vecchio ETL”, inoltre, pongono l’accento su come quest’ultimo aggiunga un pezzo all’infrastruttura generale, in quanto lo strumento di trasformazione dei dati è pensato per essere distinto sia dalla sorgente dove avviene l’estrazione, sia dalla destinazione dove avviene il caricamento. Questo pezzo in più – la famosa Staging Area – va ovviamente gestito, e quindi costa (per lo meno in termini di risorse).


ETL e Datawarehouse

Le soluzioni disponibili

Quanto detto finora, vero o falso che sia (ed io ho un giudizio molto critico al riguardo), non è utile all’azienda che ha bisogno – a detta di questi professionisti – di decidere se e come migrare all’ELT. La verità è che le aziende non hanno questo bisogno, perché non c’è nessuna scelta. Al massimo, le aziende devono decidere quando migrare da uno strumento datato (od obsoleto) ad uno moderno… ed in questi casi la risposta è spesso «il prima possibile». Non c’è nessuna scelta da effettuare perché il mercato offre soluzioni che permettono di estrarre, trasformare e caricare dove e come preferiscono, ormai da anni. È addirittura possibile effettuare la trasformazione per prima, in un processo di TEL. Se necessario, le fasi possono anche ripetersi in una catena più lunga, personalizzata e non registrata in antologia. Tutto dipende da come l’azienda decide di sviluppare il processo sulla base delle proprie preferenze e delle caratteristiche dell’infrastruttura.


Il concetto di ETL

ETL è un concetto puramente teorico, un termine per indicare un motore di (ri)elaborazione dei dati. Viene usato anche in contesti differenti dalla Business Intelligence. Tranne quando lo si sta implementando, a nessuno importa dell’ordine delle sue fasi: conta solo lo scopo. Per questo le discussioni su quando un metodo è migliore dell’altro sono spesso sterili. Ed è anche per questo nelle aziende nessuno parla di ELT, ma ancora oggi usano tutti il termine storico di ETL. È pure più facile da pronunciare.


di Thomas Tolio, pubblicato il 9 febbraio 2023