Guida Definitiva Big Data Analytics

L’enorme mole di dati raccolti da un’azienda da riutilizzare in progetti di analisi avanzata, machine learning o modellazione predittiva ha un nome: Big Data.

Questo termine è stato letto la prima voltanel 1999, quando ancora non esistevano software abbastanza sofisticati per gestire ed analizzare una gran quantità di dati. Nello stesso periodo, si comincia a parlare di Internet delle Cose, dell’interconnessione di oggetti ad Internet.

Tuttora, il campo dei Big Data è tanto appetibile quanto sottovalutato, una miniera d’oro che molti ignorano o non afferrano come dovrebbero.

O, semplicemente, non possono permettersi.

Un’analisi Big Data ottimale può essere fonte di molti vantaggi per un’azienda.

Si tratta di un campo rivoluzionario che circa il 77% delle aziende non riescono a sfruttare per mancanza di risorse e competenze interne.

L’ecosistema dei Big Data è caratterizzato da un elevato e complesso grado di interconnessione tra i vari attori (utenti, fornitori di dati o di software, data broker, imprese ed organizzazioni di ricerca, enti pubblici, ecc.). Si tratta di un contesto in cui operano poche grandi imprese multinazionali che presentano un alto livello di integrazione in tutte le fasi dell’ecosistema.

Cos’è di preciso la ‘scienza’ della Big Data Analysis? Come funziona?

Da dove proviene tutta la mole di dati da rielaborare, analizzare e sfruttare al meglio? Quali sono i reali vantaggi e quali settori in Italia investono di più in questa particolare attività?

In questa guida, cercheremo di spiegarti tutto nel modo più semplice e chiaro possibile.

Lo scopo? Imparare a valorizzare un settore nuovo e importante.

Big Data: cosa sono e da dove provengono

I Big Data rappresentano una miniera di informazioni raccolte da un’azienda da cui è possibile estrarre ed analizzare informazioni preziose. Informazioni da sfruttare in diversi progetti tra cui machine learning, analisi avanzate e modellazione predittiva.

I dati provengono da svariate fonti, tra cui:

– database clienti;

– app mobile;

– motori di ricerca (Google) e piattaforme online (Amazon);

– social network;

– transazioni commerciali;

– cartelle cliniche;

– dati generati da dispositivi e sensori in real time usati nello IoT (Internet delle Cose).

Alla base di fenomeni come l’Industria 4.0, l’Impresa 4.0, il Digital Banking e le Smart City c’è la scienza della Big Data Analytics. I dati rappresentano la leva per il business delle aziende.

La cultura dei Big Data è destinata ad essere integrata in quella del Top Management.

La fonte n.1 dei Big Data: l’individuo

La fonte numero uno di dati è l’individuo. Ogni volta che siamo connessi alla rete lasciamo molte ‘tracce’ che vengono cedute agli operatori in modo inconsapevole o informato.

Un acquisto in un negozio, una ricerca su Google, un post su Facebook, una foto, un messaggio vocale, un tweet sono tracce, dati che seminiamo sul web. Dati che possono essere raccolti, elaborati, analizzati e monetizzati. Lo studio How Much Information del 2010 ha riportato che, mediamente, ognuno di noi genera 12 gigabyte di dati tutti i giorni.

Un numero in costante crescita.

Uno dei principali meccanismi con cui gli utenti cedono dati digitali sono il download e l’utilizzo di App. In particolare, le App gratuite richiedono un numero maggiore di dati individuali rispetto a quelle a pagamento.

Il mercato delle App si concentra su poche grandi piattaforme: Facebook, YouTube, Google Gmail, Google Maps, Google Search e Google Play Services.

I dati da analizzare nel sistema Big Data possono essere usati nella loro forma originaria o pre-elaborati tramite specifici software o tool di data mining (tecniche di analisi).

Quali settori italiani investono di più in Big Data

A partire dal 2015, gli investimenti in Big Data sono costantemente cresciuti (con un tasso medio annuo del 21.3%) passando da 170 milioni di euro a circa 1,7 miliardi di euro.

Nel 2019, i maggiori investitori in progetti di Analytics sono state le grandi imprese (il 93% contro il 62% delle piccole e medie imprese).

Le PMI investono soprattutto per ottimizzare la Supply Chain, per analizzare la concorrenza e migliorare l’efficacia delle campagne marketing.

I settori che investono di più sono le banche (28%), il manifatturiero (24%), telco e media (14%), servizi, Gdo e retail (8%), assicurazioni (6%), utility (6%), Pubblica Amministrazione e Sanità (5%).

Si spende soprattutto in software (53%) cui seguono tool di ingestione dei dati, integrazione, preparazione e gestione (47%).

Big Data Analytics: vantaggi

L’analisi dei Big Data finalizzata al business ed al miglioramento del marketing nelle aziende porta numerosi vantaggi che sintetizziamo di seguito:

– Efficienza e riduzione dei rischi nelle analisi finanziarie come pure nella gestione del personale o nella Supply Chain;

– Sicurezza e prevenzione di problemi legati all’erogazione dei servizi nonché monitoraggio di eventi su cui poter intervenire tempestivamente. In questo caso, i modelli d’analisi sfruttano data-log generati da dispositivi di rete o server;

– Ottimizzazione della digital experience e maggior conoscenza dei fenomeni collegati alla clientela che possono migliorare le campagne marketing, la vendita, lo sviluppo dei prodotti. Questo è un aspetto importante perché l’analisi dei Big Data consente di aumentare il fatturato, prevedere addirittura lo sviluppo della domanda perfezionando l’offerta, supportare gli account manager a migliorare il proprio lavoro.

I punti di forza della Big Data Analytics sono le cosiddette 5 “V”:

– Volume;

– Velocità;

– Varietà:

– Valore;

– Veridicità.

Il ritmo e la velocità di raccolta dati diventano sempre più rapidi, spesso in tempo reale (Fast Data). L’ambito del Fast Data va letto in relazione agli sviluppi dell’Internet delle Cose e dell’Industria 4.0.

Le 4 grandi famiglie di Data Analytics

Internet of Things, Mobile, Social Media e Wearable trasformano imprese e Pubbliche Amministrazioni in grandi ‘fabbriche di dati’. Dati enormi raccolti nell’ordine di Terabyte.

Lavorare sui dati è, oggi, la sfida numero uno in termini di vantaggi competitivi.

Il principale compito dei Big Data è offrire la miglior rappresentazione possibile della realtà attraverso le informazioni raccolte a analizzate.

Per raggiungere questo obiettivo, bisogna sviluppare metodiche e logiche di rappresentazione attraverso processi di verifica e controllo.

Sono quattro le principali tipologie di Data Analysis:

Descriptive Analytics, ovvero l’Analisi Descrittiva che consente la visualizzazione grafica di processi aziendali e livelli di performance;

Predictive Analytics, l’Analisi Predittiva basata su modelli e metodi matematici che consentono di analizzare dati per disegnare scenari futuri;

Prescriptive Analytics, strumento che suggerisce soluzioni operative e indicazioni strategiche sulla base dell’Analisi Descrittiva e Predittiva;

Automated Analytics, con cui si entra nel campo dell’automazione attraverso soluzioni di Analytics. Grazie all’Analisi descrittiva e predittiva, l’Automated Analytics può avviare azioni precise in base a certe regole (come lo studio dei comportamenti di una macchina).

Gli ambiti del settore Analytics sono diversi ed in aggiornamento costante. Si passa dal Big Data al Data Science, dal Business Intelligence al Real Time Analytics, dal Data Analytics al Data Mining.

Big Data: la monetizzazione

La monetizzazione dei Big Data avviene attraverso la vendita o scambio di dati oppure sfruttando il valore dei dati per generare nuovi servizi o prodotti.

La Data Monetization può supportare, affiancare o completare lo sviluppo dei tradizionali core business.

Può essere diretta o indiretta.

La forma diretta si realizza con la vendita o scambio dei dati come succede, ad esempio, ad un’azienda retail che raccoglie dati dei clienti sulle preferenze di pagamento per, poi, trasferirli ad una società di digital payment nel rispetto delle regole sulla privacy. Questi dati possono essere venduti o scambiati così come sono oppure trattati, in grado di interpretare una realtà, un significato, una conoscenza. Il ‘valore’ di conoscenza di questi dati è spesso frutto del lavoro del Data Scientist, il quale grazie alla sua capacità di lettura incide sulla vendibilità dei dati stessi.

La monetizzazione indiretta dei dati prevede, invece, lo sfruttamento economico delle informazioni raccolte ed analizzate per avviare altre attività generando nuove forme di business (prodotti o servizi). Anche in questo caso, il contributo del Data Scientist è fondamentale.

Lo scorso anno, una grande impresa su due ha portato al suo interno un Data Scientist, mentre un’impresa su tre (tra quelle che già disponevano del supporto di questa figura) hanno raddoppiato questo skill. Attingendo alle sue competenze, tali imprese hanno avviato progetti complessi nell’ambito del machine learning e dei real time analytics.

Big Data e Privacy per l’analisi dei dati

Nell’ambito dei Big Data e Data Science bisogna prestare particolare attenzione al tema normativo della privacy, in particolare all’autorizzazione del trattamento dei dati per le finalità dichiarate (art. 6 del GDPRGeneral Data Protection Regulation).

Il principio normativo secondo cui si può lavorare sui dati solo se l’interessato ha espresso il consenso al trattamento dei propri dati personali per una o più finalità è alla base dell’attività del Data Scientist. Questo perché bisogna definire in anticipo lo scopo per cui si andrà a realizzare l’analisi dei dati e che deve risultare nella definizione del trattamento dati. Non è possibile trattare dati per finalità non specificate a priori.

La figura del Data Scientist

Abbiamo più volte citato la figura del Data Scientist ed è arrivato il momento di spiegare chi è e cosa fa.

Come identità, questa figura nasce nel 2008 grazie a D.J.Patill e Jeff Hammerbacher, ma è nel 2012 che inizia ad attirare l’attenzione dell’opinione pubblica. Nel 2015, viene riconosciuto ufficialmente il ruolo e la figura del Data Scientist da Obama che nomina proprio DJ Patill come primo US Chief Data Scientist.

E’ di per sé un ruolo difficile da descrivere in maniera esauriente perché è in via di definizione.

Il Data Scientist ha forti competenze interdisciplinari, padroneggia i Big Data e gli Advanced Analytics, ha spiccate competenze informatiche e linguaggi di programmazione ma deve saper leggere oltre i dati individuando i pattern, quindi conoscendo a fondo statistica e matematica.

Tra le altre competenze, ritroviamo una grande capacità di dialogo con le aree di business, una vasta conoscenza dei modelli di business potenziali ed attuali legati ai dati.

E’ chiamato a svolgere un compito di altissima responsabilità: trasformare i dati in conoscenza e la conoscenza in valore di business o di servizio.

Il suo è un lavoro creativo, affascinante, finalizzato a generare nuova conoscenza dalla conoscenza di partenza. Il Data Scientist deve possedere notevoli capacità di immaginazione ed intuizione. E’ alla costante ricerca di schemi per individuare, interpretare, comprendere per, poi, gestire fenomeni e comportamenti. Plasma, adatta, sviluppa. Oltre a possedere una grande capacità di analisi e lettura dei fenomeni di business o servizi, lo Scienziato dei Dati deve avere anche una propensione da hacker.

Tutte le attività del Data Scientist

In sintesi, il Data Scientist deve avere specifiche competenze di informatica, project management, matematica e analisi, statistica, conoscenza di core business, comunicazione e rappresentazione grafica, soft skill (gestione delle relazioni) e team work.

Cerchiamo di inquadrare e delineare la giornata tipo del Data Scientist.

La sua giornata si sviluppa secondo queste attività di base:

  • Organizzazione, mappatura e controllo delle fonti di Big Data;
  • Creazione, organizzazione e verifica dei flussi dei dati;
  • Interpretazione e trasformazione dei dati in informazioni;
  • Studio e analisi dei metodi di valorizzazione dei dati a seconda dell’area di business;
  • Analisi della customer experience e delle informazioni sui clienti in merito al core business aziendale;
  • Individuazione, creazione e sviluppo di forme d’interazione tra varie linee di attività aziendali per identificare e creare nuove forme di sviluppo tattico (cross selling) o strategico;
  • Analisi delle informazioni sui clienti per sviluppare nuovi prodotti o servizi.

La figura del Data Scientist fa da ponte tra il mondo IT e quello delle Line of Business (LOB) con, in più, la collaborazione e il dialogo costante con l’area R&D.

Data Scientist e CDO (Chief data officer) sono le due figure più importanti in questo ambito, con una fortissima vocazione multidisciplinare. Il CDO è la figura manageriale che definisce lo sviluppo delle strategie per valorizzare i dati e gestirne il ciclo di vita (dalla raccolta all’eventuale vendita o trasferimento).

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *