Come tutti i termini e le buzzword che periodicamente rappresentano argomento di discussione nei vari business, abbiamo un boom iniziale in cui tutti parlano di quel qualcosa e della tal novità, spesso menzionandola senza avere piena coscienza dell’utilità di determinate figure, strumenti, o tecnologie.
Parliamo oggi di Data Science e della figura del Data Scientist. Vi promettiamo che alla fine dell’articolo sarete in grado di capire se vi serve e perché, e saprete come sfruttare al massimo le sue potenzialità. Vi promettiamo che faremo tutto questo in 600 parole, esempi inclusi, senza ricorrere a una glamourizzazione del ruolo, utile a nessuno.
La prima domanda: cosa è un Data Scientist e perchè è un profilo così ricercato?
Un data scientist è prima di ogni cosa uno scienziato. Uno scienziato è la persona che fa delle scoperte applicando il metodo scientifico, e quindi validando o rifiutando ipotesi, con un certo grado di confidenza. Attraverso questo lavoro, lo scienziato crea conoscenza e sapere, ottiene la comprensione dei fenomeni, trova i significati. Un data scientist è uno scienziato che fa tutto questo lavorando con i dati.
Grazie all’insieme dei suoi skill, il data scientist è la persona ideale per trarre il massimo valore dai big data, e dai dati presenti in azienda in generale.
Ogni problema che ogni azienda si pone genera dati, e ogni azienda ha bisogno di analizzarli. Tutte le funzioni aziendali hanno bisogno di tali analisi, e il data scientist diviene la figura centrale rispetto a questa necessità.
Come fa il Data Scientist a fare le sue scoperte? Come lavora e con quali strumenti?
Il data scientist ha come due grandi “borse” in cui riporre i suoi strumenti.
La prima contiene le tecniche di visualizzazione dei dati, e individua in ogni singolo caso la più efficace e semplice da comunicare. Il data scientist punta al massimo della comprensione di un fenomeno complesso attraverso l’immediatezza di una rappresentazione grafica.
La seconda contiene tutti gli algoritmi in grado di attraversare i dati alla ricerca di significati. Rientrano in questa “borsa” strumenti di cui probabilmente avrete già sentito parlare come Machine Learning, Reti Neurali, Intelligenza Artificiale, Clustering, K-means,… eccetera.
Il data scientist padroneggia queste due borse grazie alle conoscenze matematiche e statistiche che sono essenziali, ed è più efficace se a queste conoscenze aggiunge quelle informatiche e quelle di dominio. Ricordate sempre che un data scientist NON è uno sviluppatore in grado di lavorare con Java e Hadoop che, seppur essenziali, da soli non creano o traggono valore dai dati.
A quali domande dell’azienda può rispondere un Data Scientist?
Concludiamo questo breve e, speriamo chiaro, articolo, con una rassegna delle domande a cui i Data Scientist possono rispondere meglio di chiunque altro.
- Quali sono le caratteristiche dei clienti che mi abbandonano? Qual è la probabilità che il cliente XYZ mi abbandoni?
- Come posso migliorare le mie performance di cross-selling e up-selling?
- Qual è la composizione dei carrelli nel mio e-commerce? I carrelli abbandonati sono in qualche modo diversi dal resto?
- Quali sono le cause dei problemi e delle rotture nelle macchine che usiamo in produzione?
- Come posso intercettare i problemi delle macchine in tempo reale, evitare che si rompano e risparmiare xxx Euro?
- Come posso ottimizzare l’instradamento delle merci?
- Dove devo agire per abbassare i costi della logistica?
- Come posso analizzare tutti gli articoli del mio catalogo, composto da migliaia/milioni di SKU?
- Come posso essere più vicino al cliente e sapere in ogni istante la sua storia, per offirgli la migliore esperienza possibile?
- A quale sottoinsieme della mia clientela dovrò indirizzare questa promozione per far si che il ritorno sia massimo?