Il processo ETL diventa “integrazione dei dati”

I processi ETL (estrazione, trasformazione e caricamento dei dati) erano spesso orientati al batch ed eseguiti di notte. Al giorno d'oggi, il termine suona quasi antiquato, dato che stiamo parlando più di integrazione dei dati, spiega il responsabile DACH di Informatica.

Quando Informatica è stata fondata 26 anni fa, si trattava principalmente di estrarre i dati dai silos dei grandi clienti con mainframe per poterli utilizzare ulteriormente. "Questo ha avuto molto a che fare con il lavoro di interfaccia. Per esempio, immaginate un sistema su un mainframe che gestisce i processi logistici. Per far uscire i dati da lì e poterli utilizzare in un sistema di contabilità finanziaria o di reporting, le interfacce sono state programmate automaticamente in background", spiega Oliver Schröder, Managing Director DACH di Informatica. Gli standard di interfaccia aperti come oggi non esistevano, quindi bisognava creare delle interfacce proprie per il movimento dei dati. In questo contesto, l'idea di base del principio ETL, cioè l'estrazione, la trasformazione e il caricamento dei dati, proviene da Informatica, dice il capo del DACH. "Anche se la terminologia è stata coniata da Gartner e altri analisti". L'estrazione dei dati (dal sistema A), la trasformazione (per il sistema B) e il caricamento dei dati (dal sistema B) venivano spesso eseguiti di notte.

ETL suona quasi antiquato

Anche l'accesso in tempo reale non era un problema allora, e nel complesso il termine ETL suona quasi antiquato, anche se rappresenta le basi dell'informatica. Oggi si parla di integrazione dei dati, indipendentemente dal fatto che si tratti dello scambio di dati tramite interfacce aperte attraverso i confini del sistema, per esempio, di soluzioni Salesforce, Oracle o IBM, o dello spostamento di dati tra i mondi on-premises e cloud.

Il tema della "gestione della qualità dei dati" ha guadagnato immensamente in importanza. Da un lato, a livello dell'architettura di stoccaggio, cioè la questione di dove si trovano i dati e se vi sono collocati correttamente. D'altra parte, la questione della misura in cui i dati sono corretti in termini di contenuto. "Per esempio, se un numero di carta di credito memorizzato è coerente rispetto alla cifra di controllo è una domanda di questo settore. O la questione se c'è una parola accanto a una quantità o viceversa. Quando si tratta di gestione dei dati master, il problema dei duplicati gioca un ruolo centrale", dice Schröder. Uno dei compiti del master data management è quello di mettere ordine.

Problemi vecchi e nuovi

Un problema quasi universale in questo contesto è che gli stessi clienti sono memorizzati in diversi sistemi, per esempio una volta come cliente di preventivo in Salesforce e una volta come cliente di fatturazione in SAP. Altri problemi causati dalla trasformazione digitale sono unici per ogni settore. Schröder nomina i livelli ai quali si verificano: Cloud/Hybrid, Next Gen Analytics, 360 Engagement e Data Governance/ Compliance. La sfida tecnologica qui è "essere in grado di gestire i dati dai classici database relazionali, dati memorizzati basati su file system e formati Big Data, come quelli necessari per i sistemi Hadoop, in egual misura". Questo è tutt'altro che banale, secondo il capo di Informatica. Tutti questi argomenti ora migreranno gradualmente dai grandi clienti - come agli inizi di Informatica - fino alle aziende di medie dimensioni che stanno digitalizzando il loro business.

La strategia dei partner viene adattata

L'aspetto della governance è ora un driver molto importante per sempre più aziende per affrontare il tema della gestione dei dati: "Che si tratti di raccogliere correttamente i dati sui percorsi di trasporto per la verifica della catena di approvvigionamento o sul tema DSGVO. Basilea III e l'imminente Basilea IV giocano anche un ruolo qui", riferisce il professionista dei dati.

"Sullo sfondo di questi sviluppi, la nostra strategia dei partner sta cambiando", rivela il capo di Informatica. Il numero di partner è destinato ad aumentare e Informatica è alla ricerca di rivenditori a valore aggiunto che sono profondamente radicati nel loro settore. Un tipico candidato per un futuro VAR di Informatica ha un accesso diretto al cliente, per esempio, legato all'ERP o al DRM. I temi dell'integrazione dei dati, della qualità dei dati e della gestione dei dati master vengono poi aggiunti automaticamente.


Pagine utili:

Informazioni sul formato .dat

Lascia un commento