Glossario: Data Mining
Con data mining si definisce l’estrazione complessa di informazioni implicite, precedentemente sconosciute e potenzialmente utili dai dati e l’esplorazione e l’analisi, per mezzo di sistemi automatici e semiautomatici, di grandi quantità di dati al fine di scoprire pattern significativi.
Si tratta di un processo multidisciplinare che sfrutta le tecniche statistiche ma anche tecnologie di intelligenza artificiale e di machine learning per estrarre delle informazioni funzionali. In pratica, il data mining fa sì che, partendo da informazioni contenute in un database senza un ordine apparente, si arrivi a una conoscenza di questi dati sfruttabile per vari fini. Questo processo viene chiamato KDD, acronimo di Knowledge Discovery in Databases.
Le principali finalità dell’utilizzo del data mining sono le analisi descrittive e le analisi predittive. Per quanto riguarda la prima categoria, viene utilizzata la tecnica del clustering che suddivide i dati in diversi gruppi sulla base di caratteristiche che li avvicinano. Per le analisi predittive, invece, si impiegano tecniche come la regressione, che misura la relazione tra una variabile dipendente e una serie di variabili indipendenti, e le reti neurali, cioè dei programmi di computer in grado di rintracciare dei pattern o dei modelli.
Il data mining si rende necessario perché la quantità di dati memorizzata su supporti informatici è in continuo aumento e molte delle informazioni presenti sui dati non sono direttamente evidenti. Il data mining può essere utilizzato nei più svariati settori, quali: marketing, economia e finanza, scienza, ICT, statistica e industria.
L’analisi dei big data consente alle aziende, anche tramite CRM e ERP, di ottenere informazioni importanti sui consumatori, sul mercato di riferimento e su come ottimizzare i processi di business. Le tecniche di data mining sono, infatti, uno strumento fondamentale per raggiungere i diversi obiettivi aziendali.