Esplorare i tipi di analisi dei dati
Obiettivi di apprendimento
Al completamento di questa unità, sarai in grado di:
- Spiegare in che modo l'analisi dei dati migliora il processo decisionale.
- Definire i diversi tipi di analisi.
- Spiegare l'analisi descrittiva.
Arrivare agli approfondimenti
Raccogliere punti dati è solo il primo passo. Cosa ne fai di tutti quei dati? Devi poter mettere insieme le informazioni per aiutare le persone a prendere decisioni. È proprio questo l'obiettivo principale dell'analisi dei dati. In questo modulo ti presentiamo i diversi tipi di analisi dei dati, in particolare l'analisi descrittiva, e come vengono utilizzati in casi di business comuni.
Guarda questo video di Rafael "Raf" Lopes, Senior Cloud Technologist in AWS. Il quiz al termine di questa unità pone domande sul contenuto del video. Guardalo per avere le informazioni che ti servono per rispondere alle domande alla fine di questa unità.
Attenzione, Raf usa spesso il termine corso e lezione. Nel nostro contesto, si intende il modulo.
Visualizza la trascrizione
[Raf] Buongiorno. Se siete qui, probabilmente vi interessa l'analisi dei dati. Benissimo. Permettetemi di condividere con voi la proposta di valore riguardo a cosa sia l'analisi dei dati.
Il nostro primo pensiero quando parliamo di analisi dei dati è come usare i dati raccolti per produrre informazioni che si riveleranno utili per le esigenze aziendali future. Queste informazioni sono chiamate "approfondimenti".
A volte, il percorso verso la generazione di approfondimenti estratti dai dati può essere vasto e complesso e richiedere l'uso del machine learning. Altre volte invece può essere semplice e veloce: se il set di dati è pronto, bisogna solo eseguire un'analisi dei dati descrittiva. Ciò detto, l'analisi dei dati è la scienza che si occupa della gestione dei dati raccolti dai sistemi informatici allo scopo di generare approfondimenti che miglioreranno i processi decisionali con fatti basati su dati.
Al giorno d'oggi, l'analisi dei dati è ampiamente usata per l'e-commerce e i social media. Ma la conoscenza può e deve essere applicata alla sicurezza delle informazioni, alla logistica, alla produzione industriale, all'Internet delle cose e a molto altro.
Esistono quattro principali tipi di analisi dei dati. Eccoli elencati in ordine di complessità: analisi descrittiva, diagnostica, predittiva e prescrittiva. Vi parlerò brevemente di ciascuno di questi tipi. Mi dilungherò in particolare sull'analisi descrittiva dato che, in questo corso introduttivo, è l'aspetto su cui mi soffermerò maggiormente.
L'analisi descrittiva è un tipo di analisi dei dati usato soprattutto per ottenere informazioni su ciò che è successo. Ha lo scopo di permettervi di usare i dati raccolti da un sistema per aiutarvi a identificare cosa è andato storto, cosa può essere migliorato o quali metriche non riportano i valori che dovrebbero.
Poiché questo tipo di analisi dei dati è ampiamente usato per riassumere grandi set di dati al fine di descrivere i risultati agli stakeholder, pensate all'analisi descrittiva come a qualcosa che si limita soltanto a riportare ciò che sta accadendo. Le metriche più pertinenti basate su questi sistemi sono note per lo più come KPI (Key Performance Indicators) o indicatori di prestazione chiave.
Identificare ciò che è accaduto può essere molto importante per alcuni settori di mercato e a volte è sufficiente per soddisfare l'esigenza di ulteriori indagini su un problema. Facciamo un esempio di come l'analisi descrittiva dei dati può essere utile per individuare i KPI giusti su cui sensibilizzare gli stakeholder quando prendono decisioni basate sui dati per risolvere potenziali problemi.
Immaginate di avere un sito web di e-commerce in cui raccogliete metriche riguardanti il tempo necessario per l'elaborazione di un pagamento. In questo sito web usate un gateway per i pagamenti esterni per completare gli acquisti. Quindi, ogni volta che un cliente compra qualcosa sul vostro sito web viene reindirizzato a quel gateway per i pagamenti e voi ricevete la conferma che il cliente ha pagato nel momento in cui lo fa. Un set di KPI pertinenti per un'analisi descrittiva efficace, in questo caso, potrebbero essere le metriche riguardanti il tempo necessario per completare la transazione, il numero di transazioni completate e il numero di transazioni annullate.
Ora, se notate un picco sia del numero di transazioni annullate che del tempo necessario per completare una transazione, questo potrebbe essere un buon indicatore del fatto che quelle transazioni vengono annullate perché richiedono troppo tempo. Può indicare l'esistenza di una correlazione tra quei KPI e aiutare quindi gli amministratori di sistema e i titolari dell'azienda a risolvere un potenziale problema che potrebbe avere ripercussioni sulle vendite.
Questo stesso concetto si applica al tempo necessario per completare le transazioni. Se avete modo di approfondire quelle metriche separando ogni fase lungo l'intera durata della transazione, avrete informazioni ancora più dettagliate per individuare il punto esatto in cui intervenire per risolvere il problema. Di certo non volete venire a conoscenza di malfunzionamenti del sistema da feed di social media o da input dei clienti. In questo caso il monitoraggio è fondamentale e usiamo un insieme di metriche molto semplice per iniziare a risolvere un problema che interessa l'azienda.
In breve, l'analisi dei dati descrittiva vi informa su quanto sta accadendo. Potete anche eseguire un'analisi dei dati descrittiva se avete dati che riguardano le attività degli utenti, i feed dei social media, l'Internet delle cose o i registri di sicurezza del sistema. Come ho detto, i casi d'uso possono variare parecchio, ma una cosa è certa: una volta che avete le conoscenze necessarie per eseguire un'analisi dei dati descrittiva, potete e dovete usare le stesse conoscenze per lavorare con set di dati diversi.
Bene. Ora abbiamo acquisito delle basi solide sull'essenza dell'analisi dei dati descrittiva. E gli altri tre tipi?
Nell'esempio abbiamo citato una matrice riguardante la durata delle transazioni e il numero di transazioni non riuscite. In quel caso, voi eravate responsabili di ottenere gli approfondimenti, di generare l'idea, per mettere in relazione quelle due metriche allo scopo di identificare il problema. Il sistema non le ha collegate tra loro e vi ha restituito una metrica consolidata, o proiettata, denominata probabilità di problema con il gateway per i pagamenti. Al giorno d'oggi capita spesso di avere centinaia o anche migliaia di queste metriche nei sistemi. E l'analisi diagnostica vi aiuta perché, superando l'ambito puramente informativo, esegue una diagnosi tramite ulteriori indagini e mette i relazione tra loro quei KPI per suggerirvi dove potrebbe risiedere il potenziale problema. Mi piace descrivere l'analisi diagnostica come un insieme di azioni che un sistema può eseguire per aiutare gli stakeholder a capire perché è accaduto qualcosa. La parola da ricordare è "perché".
Il terzo tipo di analisi dei dati è l'analisi predittiva. L'analisi dei dati predittiva implica maggiore complessità perché, come suggerisce il nome, preannuncia ciò che probabilmente accadrà in futuro sulla base di dati del passato o di un incrocio tra più set e origini di dati. In sostanza, cerca in qualche modo di prevedere il futuro sulla base di azioni del passato. L'uso di reti neurali, regressione e alberi di decisione è molto diffuso nell'analisi diagnostica e ne parleremo in un altro corso.
L'ultima, ma non per importanza, è l'analisi prescrittiva, che sostanzialmente è la somma di tutte le precedenti. L'analisi prescrittiva fa un passo avanti e suggerisce agli stakeholder quali sono le decisioni più fortemente guidate dai dati che devono essere prese sulla base di eventi ed esiti verificatisi nel passato. L'analisi prescrittiva dipende in larga misura da strategie di machine learning per individuare pattern con le relative misure correttive osservando e incrociando vasti set di dati.
A prescindere dal tipo di analisi che deciderete di apprendere e applicare, l'analisi dei dati si colloca al crocevia tra l'uso della tecnologia dell'informazione, la statistica e la conoscenza del settore, come social media, aziende o verticali di settore. In questo corso, ci concentreremo su come usare i servizi AWS per eseguire analisi descrittive su ciò che accade in un account AWS utilizzando i registri di sicurezza.
Ora che avete compreso quali sono i diversi tipi di analisi dei dati, continuiamo il percorso esplorando alcuni altri esempi che mostrano in quali aspetti della nostra vita interviene attualmente l'analisi dei dati.
Hai guardato il video?
Ricorda, il quiz riguarda il video di questa unità. Se non lo hai ancora guardato, fallo ora. Poi potrai rispondere al quiz.