I dati si riferiscono a informazioni distinte, solitamente formattate e archiviate in modo conforme a uno scopo specifico. I dati possono esistere in varie forme: come numeri o testo registrati su carta, come bit o byte archiviati nella memoria elettronica o come fatti che vivono nella mente di una persona. Dall'avvento dell'informatica a metà del 1900, tuttavia, i dati si riferiscono più comunemente a informazioni che vengono trasmesse o archiviate elettronicamente.
Grammaticamente, i dati sono la forma plurale del dato singolare, ma in pratica i dati sono ampiamente usati come nomi di massa, come sabbia o acqua. Ad esempio, si potrebbe dire che i dati dimostrano che qualcosa è vero in questo caso, "dati" si riferisce a molte informazioni che vengono utilizzate collettivamente per convalidare un'affermazione. Tuttavia, non tutti gli scrittori accettano il popolare nome di massa. Alcuni editori accademici e tecnici sono irremovibili sulla distinzione latina plurale e singolare ("l'insieme di dati dimostrano" e "un dato dimostra").
Dati leggibili dalla macchina e leggibili dall'uomo
Tutti i dati possono essere classificati come leggibili dalla macchina, leggibili dall'uomo o entrambi. I dati leggibili dall'uomo utilizzano formati in linguaggio naturale (come un file di testo contenente codici ASCII o un documento PDF), mentre i dati leggibili dalla macchina utilizzano linguaggi informatici formalmente strutturati (Parquet, Avro, ecc.) Per essere letti da sistemi informatici o software. Alcuni dati sono leggibili sia da macchine che da esseri umani, come nel caso di CSV, HTML o JSON.
Il confine tra i dati leggibili dalla macchina e quelli leggibili dall'uomo sta diventando sempre più sfumato perché così tanti formati che sono prevalenti oggi sono abbastanza accessibili per essere navigati da un essere umano ma abbastanza strutturati per essere elaborati da una macchina. Questo è in gran parte il risultato dell'intelligenza artificiale, dell'apprendimento automatico e dell'automazione, che ottimizza le attività ei flussi di lavoro in modo che l'immissione e l'analisi manuale dei dati vengano eseguite da una macchina anziché da un essere umano. Tuttavia, questi processi devono mantenere la loro leggibilità umana nel caso in cui la programmazione debba essere modificata. La maggior parte dei dati in questi casi esiste anche nel vuoto e non ha molto significato senza contesto da una prospettiva umana.
Frasi di dati nella tecnologia
I dati sono diventati la prima linea di molte conversazioni tradizionali sulla tecnologia. Le nuove innovazioni traggono costantemente commenti sui dati, su come li usiamo e li analizziamo e su implicazioni più ampie per questi effetti. Di conseguenza, il popolare linguaggio IT è arrivato a includere una serie di frasi nuove e vecchie:
-
Big data: un volume enorme di dati strutturati e non strutturati che è troppo grande per essere elaborato utilizzando database e tecnologie software tradizionali.
-
Analisi dei big data: il processo di raccolta, organizzazione e sintesi di grandi set di dati per scoprire schemi o altre informazioni utili.
-
Data center: infrastruttura fisica o virtuale utilizzata dalle aziende per ospitare computer, storage e sistemi e componenti di rete per le esigenze IT dell'azienda.
-
Integrità dei dati: la validità dei dati, che può essere compromessa in diversi modi, inclusi errori umani o errori di trasferimento.
-
Data miner: un'applicazione software che monitora e / o analizza le attività di un computer, e successivamente del suo utente, per raccogliere informazioni.
-
Data mining: una classe di applicazioni di database che cercano modelli nascosti in un gruppo di dati che possono essere utilizzati per prevedere / anticipare il comportamento futuro.
-
Data warehouse: un sistema di gestione dei dati che utilizza i dati provenienti da più origini per promuovere la business intelligence.
-
Database: una raccolta di punti dati organizzati in modo facile da manovrare da un sistema informatico.
-
Metadati: informazioni di riepilogo su un set di dati.
-
Dati grezzi: informazioni che sono state raccolte ma non formattate o analizzate.
-
Dati strutturati: tutti i dati che risiedono in un campo fisso all'interno di un record o file, inclusi i dati contenuti in database relazionali e fogli di calcolo.
-
Dati non strutturati: informazioni che non risiedono in un database riga-colonna tradizionale come i dati strutturati.