Generalmente, i big data si riferiscono a grandi quantità di dati che superano le capacità degli ambienti IT convenzionali. La gestione di questi volumi di dati richiede nuove infrastrutture IT per elaborare i dati ed è una delle principali tendenze attuali dell'IT.
Il termine "big data" non è esattamente definito. Tuttavia, si riferisce a serie di dati che sono così grandi che i sistemi di database stabiliti hanno problemi a gestire questi dati in modo efficiente. Questi problemi vanno dalla semplice cattura dei dati, alla memorizzazione, distribuzione e ricerca degli stessi, all'analisi e visualizzazione. Nelle aziende, i Big Data sono uno degli argomenti più importanti (o la questione di come questi volumi di dati possono essere utilizzati in modo significativo).
Quando sono emersi i Big Data?
I grandi insiemi di dati sono un fenomeno che è entrato per la prima volta nel mirino delle aziende attraverso l'esteso collegamento in rete di dispositivi di ogni tipo. In tutto il mondo, la quantità di dati provenienti da macchine, sensori, chip RFID in prodotti di tutti i tipi e, ultimo ma non meno importante, l'internet accessibile al pubblico è aumentato drammaticamente. Nel 2011, più di 1 zettabyte è stato trasferito in tutto il mondo per la prima volta; entro il 2020, si prevede che sarà 35 volte quella quantità.
Altra responsabile del boom del termine Big Data sono diversi formati di file che hanno trovato la loro strada nei database classici. La mancanza di struttura per elaborare questi tipi di dati pone anche grandi difficoltà per i sistemi di database classici. Allo stesso tempo, l'uso corretto dei Big Data è un grande vantaggio, ed è per questo che le grandi aziende non possono permettersi di fare a meno delle soluzioni.
Perché i Big Data sono un problema?
Molte soluzioni di database conosciute non sono più adatte a gestire i dati a causa della quantità di dati. I database relazionali non possono gestire un volume molto grande, mentre molti database basati su processi ETL sono troppo lenti. Sono quindi necessari nuovi metodi per analizzare i volumi di dati ad una velocità ragionevole.
In quali aree i Big Data offrono soluzioni?
Da un lato, i Big Data sono dedicati all'elaborazione di volumi di dati molto grandi e anche di diversi set di dati. Nell'area dell'analitica, invece, si tratta del data mining e della creazione di modelli per valutare quei dati. Un altro obiettivo importante è la velocità: nonostante i volumi di dati in drastico aumento, i dati dovrebbero essere recuperabili più rapidamente ed essere anche più facili da selezionare. Infine, la ricerca viene condotta su soluzioni che permettono di semplificare la strutturazione dei dati e la gestione di diversi tipi di dati.
Le aziende più grandi sono anche classicamente quelle che portano avanti la ricerca più velocemente. Microsoft, SAP, Google e altre aziende stanno lavorando su soluzioni per gestire i Big Data in modo appropriato.