I dati strutturati si riferiscono a tutti i dati che risiedono in un campo fisso all'interno di un record o di un file. Ciò include i dati contenuti in database relazionali e fogli di calcolo.
Caratteristiche dei dati strutturati
I dati strutturati dipendono innanzitutto dalla creazione di un modello di dati, un modello dei tipi di dati aziendali che verranno registrati e del modo in cui verranno archiviati, elaborati e accessibili. Ciò include la definizione di quali campi di dati verranno archiviati e come tali dati verranno archiviati: tipo di dati (numerico, valuta, alfabetico, nome, data, indirizzo) e qualsiasi restrizione sull'input dei dati (numero di caratteri; limitato a determinati termini come come Sig., Sig.ra o Dott .; M o F).
I dati strutturati hanno il vantaggio di essere facilmente inseriti, archiviati, interrogati e analizzati. Un tempo, a causa degli elevati costi e dei limiti di prestazioni di archiviazione, memoria ed elaborazione, database relazionali e fogli di calcolo che utilizzano dati strutturati erano l'unico modo per gestire i dati in modo efficace. Tutto ciò che non poteva rientrare in una struttura ben organizzata dovrebbe essere conservato su carta in uno schedario.
Gestione dei dati strutturati
I dati strutturati vengono spesso gestiti utilizzando SQL (Structured Query Language), un linguaggio di programmazione creato per la gestione e l'interrogazione dei dati nei sistemi di gestione di database relazionali. Sviluppato originariamente da IBM all'inizio degli anni '1970 e successivamente sviluppato commercialmente da Relational Software, Inc. (ora Oracle Corporation).
I dati strutturati rappresentavano un enorme miglioramento rispetto ai sistemi non strutturati rigorosamente cartacei, ma la vita non sempre rientra in piccole scatole ordinate. Di conseguenza, i dati strutturati dovevano sempre essere integrati da supporti cartacei o microfilm. Poiché le prestazioni della tecnologia hanno continuato a migliorare e i prezzi sono diminuiti, è stato possibile introdurre nei sistemi informatici dati non strutturati e semi-strutturati.
Dati non strutturati e semi-strutturati
I dati non strutturati sono tutte quelle cose che non possono essere classificate così facilmente e stare in una scatola ordinata: foto e immagini grafiche, video, dati di strumenti in streaming, pagine web, file PDF, presentazioni di PowerPoint, e-mail, voci di blog, wiki e documenti di elaborazione testi .
I dati semi-strutturati sono un incrocio tra i due. È un tipo di dati strutturati, ma manca della rigida struttura del modello di dati. Con i dati semi-strutturati, i tag o altri tipi di marcatori vengono utilizzati per identificare determinati elementi all'interno dei dati, ma i dati non hanno una struttura rigida. Ad esempio, il software di elaborazione testi ora può includere metadati che mostrano il nome dell'autore e la data di creazione, con la maggior parte del documento che è solo testo non strutturato. Le e-mail hanno il mittente, il destinatario, la data, l'ora e altri campi fissi aggiunti ai dati non strutturati del contenuto del messaggio e degli eventuali allegati. Le foto o altri elementi grafici possono essere contrassegnati con parole chiave come il creatore, la data, la posizione e le parole chiave, rendendo possibile organizzare e individuare gli elementi grafici. XML e altri linguaggi di markup vengono spesso utilizzati per gestire i dati semistrutturati.
Standard per la tecnologia dei dati strutturati
SQL è uno standard dell'American National Standards Institute dal 1986. È gestito dall'International Committee for Information Technology Standards (INCITS) Comitato Tecnico DM 32 Gestione e interscambio dei dati. Il comitato ha due gruppi di lavoro, uno per i database e l'altro per i metadati. Partecipano tutti HP, CA, IBM, Microsoft, Oracle, Sybase (SAP) e Teradata, nonché diverse agenzie del governo federale. Entrambi i documenti di progetto del comitato hanno collegamenti ad ulteriori informazioni su ciascun progetto. SQL è diventato uno standard ISO (International Organization for Standards) nel 1987. Gli standard pubblicati sono disponibili per l'acquisto presso il Negozio eStandard ANSI, secondo la classificazione INCITS / ISO / IEC 9075.