Una query è una richiesta specifica di informazioni da un database. In particolare in sistemi di database robusti, le query facilitano la percezione delle tendenze ad alto livello o apportano modifiche ai dati in grandi quantità. Le query consentono agli utenti di individuare record che soddisfano determinati criteri, eseguire calcoli complessi, applicare operazioni complesse a un set di dati di grandi dimensioni e automatizzare le funzioni essenziali per la gestione dei dati. Consentono inoltre di consolidare i dati in informazioni digeribili a scopo di reporting.
Tipi di query
Indipendentemente dal database o dal linguaggio di query utilizzato, esistono due tipi principali di query che possono essere utilizzati per obiettivi diversi:
- Seleziona query restituire informazioni da una o più tabelle. Sebbene questo sia il tipo di query più semplice, è possibile utilizzare query di selezione per specificare quanti risultati vengono restituiti, l'ordine in cui vengono visualizzati, le origini utilizzate ei parametri per un record da includere.
- Query sull'azione eseguire un comando sui dati che sono stati recuperati, come eliminare, modificare, creare o aggiornare. Questa query consente a un utente di modificare un numero elevato di record in blocco anziché uno alla volta.
Lingue di query
Oggi esistono numerosi linguaggi di query. Il linguaggio più diffuso è SQL (Structured Query Language), che non deve essere confuso con Microsoft SQL Server o la classe di database NewSQL. SQL è compatibile con qualsiasi database e funge da base per molti adattamenti del linguaggio di query, quindi è diventato un must per la maggior parte dei data scientist. Altri linguaggi includono XQuery per documenti XML, SPARQL per il modello di dati RDF (Resource Description Framework) e altri.