Ciao! Ti diamo il benvenuto in questo nuovo articolo targato Thesis 4u!
Oggi affronteremo il tema dei Big Data, in italiano Megadati, e cercheremo di capire perché negli ultimi anni tutti ne parlino e sembrino così tanto interessati a queste grandi quantità di informazioni che viaggiano in rete.
Ultimamente le cosiddette Buzzword sono all’ordine del giorno e spesso si fatica a comprendere il significato originale dei termini tecnici di uso comune, ma in questo articolo proveremo ad andare al di là delle mode, e ad arrivare al nocciolo della domanda: a cosa servono praticamente i dati che vengono generati da tutti noi?
Definizioni e sinonimi: cosa s’intende per Big Data?
Come abbiamo già accennato nell’introduzione, la parola Big Data è un termine usato da tanti, ma conosciuto da pochi, quindi siamo davvero sicuri di sapere che cosa significa?
Un dato è un’informazione, quindi molto banalmente Big Data sta per “grande informazione“. Al giorno d’oggi stiamo vivendo una vera e propria rivoluzione che influenza la vita quotidiana, ed è bene capire il cuore di questo cambiamento per esserne tutti protagonisti: partiamo allora dall’introduzione al problema.
Ogni giorno diversi dispositivi e fonti, quali persone, post sui Social Network, sensori e macchinari, producono una quantità enorme di dati: non stiamo parlando unicamente di Internet, ma anche semplicemente bippare una carta su un autobus o al supermercato produce delle informazioni, che necessitano di essere analizzate con tecnologie specifiche.
Infatti, queste grandi quantità di dati, possono essere messe in correlazione tra di loro, e grazie all’utilizzo di algoritmi in grado di trattare tante variabili in poco tempo, è possibile giungere a pattern e modelli di interpretazione, che uniti a tecniche di Intelligenza Artificiale, portano vantaggi importantissimi in vari contesti applicativi.
La scoperta dell’utilizzo che si può fare di tutti questi dati, ha portato ad una rivoluzione dei mercati e alla cosiddetta “Onnipotenza delle Big Tech“, che suscita preoccupazione per i dati e per l’innovazione che risiede nelle mani di pochi colossi a livello globale.
Infatti, sembra che ormai l’economia si regga quasi unicamente sui dati, pensiamo a Google, Amazon, Apple, Facebook, giganti colossi alimentati dai dati che circolano in rete, a tal punto che ci si chiede se i dati siano a questo punto una risorsa più importante del petrolio.
Quindi è vero, il dato è un’informazione, ma è anche un vero e proprio modello di business che produce moltissimi benefici (da questo punto di vista, persino scrivere la propria data di nascita su Facebook costituisce una transazione economica), ma anche tante domande e perplessità, e in generale ci si chiede: “fino a che punto possiamo parlare di diritti di proprietà dei dati?”.
Prima di considerare questioni di questo tipo però, andiamo a dare una definizione più tecnica di Big Data, attraverso le cosiddette “cinque V”: volume, varietà, velocità, valore, veridicità.
I Big Data spiegati attraverso le cinque V.
Ora che abbiamo visto in generale cosa s’intende quando si parla di Big Data, andiamo a dare una definizione più tecnica dei Megadati, passando da cinque aggettivi che caratterizzano tutte le grandi quantità di informazioni.
Per spiegare meglio questo concetto, prenderò come esempio pratico l’enorme mole di informazioni prodotte ogni giorno, in tutto il mondo, in ambito sanitario.
1. Volume.
Pensiamo alle migliaia di strutture ospedaliere presenti in tutto il mondo, ma non solo, pensiamo alle cliniche, agli ambulatori privati, ai laboratori di analisi e ricerca. Pensiamo ai macchinari che effettuano misurazioni, che emettono radiazioni e pensiamo ai pazienti che si recano presso queste strutture, e proviamo ad immaginare l’enorme quantità di dati che quotidianamente vengono prodotti (e stiamo considerando solo l’ambito sanitario!).
2. Varietà.
All’interno di una struttura ospedaliera i dati provengono da fonti eterogenee: dalle misurazioni effettuate su un paziente, ai parametri di setup di un macchinario. Inoltre, questi dati che già di per se sono molto differenti tra loro, possono essere collezionati in maniera diversa, ovvero possono essere:
- strutturati, quindi organizzati secondo schemi e tabelle rigide (ad esempio una tabella contenente terapia-posologia-durata-farmaco..);
- non strutturati, quindi conservati senza alcuno schema (ad esempio un articolo che parla di malattie cardiovascolari);
- semi-strutturati, ovvero che conservano caratteristiche simili alle prime due tipologie.
Infine, la varietà dipende anche dal numero di azioni che hanno portato alla generazione del dato, e dall’impiego attuale e prospettico del dato, concetti che risiedono anche nella definizione di Valore.
3. Velocità.
Pensiamo alla velocità con cui i dati vengono prodotti all’interno di un reparto dell’ospedale, e adesso moltiplichiamola per ogni singolo reparto di ogni singolo ospedale del mondo!
4. Valore.
Qual è il fine dei dati prodotti in ambito sanitario? I dati prodotti all’interno di un laboratorio di ricerca ad esempio, sono fondamentali, in quanto permettono di studiare le informazioni raccolte al fine di prevenire alcune malattie, rendere curabili malattie che prima erano incurabili, assicurare un trattamento migliore ai pazienti.
5. Veridicità.
L’affidabilità dei dati collezionati e analizzati è necessaria se si vogliono raggiungere gli obiettivi prefissati. I dati devono essere il più accurato possibile: pensiamo ad un paziente che si sposta da una struttura ospedaliera all’altra, e al danno che può provocare un’errata comunicazione della cartella clinica del paziente tra gli ospedali!
Quali sono le tecniche di processazione dei Big Data?
Come abbiamo visto, i Big Data provengono da giornali, radio, televisione, Social Media e tantissime altre fonti. Il ciclo tecnologico che andremo ad analizzare in questo paragrafo parte appunto dalla collezione dei Big Data: queste grandi quantità di dati alimentano le tecniche di Data Mining, che formano algoritmi, che addestrano le tecniche di Machine Learning, le quali insegnano la cosiddetta Intelligenza Artificiale, la quale a sua volta genera altri dati.
Molto probabilmente tutte queste Buzzword non fanno altro che confonderti e magari anche infastidirti se non hai la minima idea di ciò di cui stiamo parlando, ma non preoccuparti, adesso faremo chiarezza e ti spiegherò passo per passo il processo tecnologico che porta da dati grezzi ad importantissime innovazioni e tecniche.
- Il Data Mining è il processo di trasformazione di dati grezzi (tantissimi, alla rinfusa e provenienti da diverse fonti) in dati utili.
- Gli algoritmi che utilizzano le tecniche di Data Mining sono di diversi tipi: esistono algoritmi che analizzano i dati per previsioni future, e i cosiddetti Algoritmi di Raccomandazione, attraverso i quali ci vengono raccomandati oggetti simili o compatibili con quelli già acquistati.
- Il Machine Learning racchiude l’insieme di tecniche che consentono ad un computer di imparare ad effettuare determinate operazioni, senza che venga implementato un software specifico che effettui tali operazioni (un esempio pratico è il riconoscimento di immagini).
- L’intelligenza Artificiale è l’obiettivo che vogliamo raggiungere, ovvero sviluppare del software/hardware che pensi e risolva problemi che noi esseri umani risolviamo facilmente, ma sono difficili per una macchina.
Se vuoi approfondire il concetto di Machine Learning, ti consiglio un video molto utile per comprenderlo al meglio.
Big Data: utilizzo concreto ed esempi pratici.
Abbiamo visto teoricamente cosa sono i Big Data, addentrandoci nel significato tecnico e cercando di spiegarne le caratteristiche fondamentali attraverso un esempio pratico, poi ci siamo chiesti in che modo i Big Data possano essere collezionati e analizzati.
Come promesso però, adesso andremo a vedere in che modo la processazione dei Big Data porta all’estrazione di un valore economico dai dati così elaborati, ed infine ad innovazione ed enormi vantaggi in vari ambiti e contesti (come vedremo, nessun settore è escluso!).
1. Settore dei veicoli, dei trasporti, delle telecamere, della domotica e dei videogiochi.
Automobili completamente autonome, sicurezza della guida autonoma che dipende dalla capacità del computer di bordo di mappare tutti i dati sul traffico e sul meteo, sensori interni ed esterni. Tra gli obiettivi in questo ambito rientrano anche migliorare i servizi di logistica in modo tale da velocizzare l’incontro tra domanda e offerta e migliorare i comportamenti dei conducenti.
Possibilità di raccogliere dati che riguardano il tempo di permanenza in negozio dei consumatori, case intelligenti dotate di dispositivi collegati ad internet, collezionare dati che permettono di capire quando un giocatore si ferma, si stoppa o si arrende più frequentemente in modo tale da migliorare l’esperienza di gioco.
2. Settore ambientale, energetico, agricolo ed edilizio.
Dati prodotti dai modelli atmosferici, dalla misurazione della qualità dell’aria. Tra gli obiettivi abbiamo capire quali sono gli effetti prodotti da catastrofi ambientali come ad esempio un uragano, in modo tale da attuare le migliori contromisure, o addirittura andare a prevedere con giorni di anticipo un possibile disastro.
Rientrano in questo settore anche lo studio dell’andamento della domanda e della disponibilità dell’energia in modo tale da programmare e contrastare i costi per l’estrazione del petrolio.
Gli stessi Big Data possono avere un’enorme applicazione nel campo edilizio: i big data forniscono supporto alla mano umana nel controllo delle eventuali modifiche e alterazioni dei materiali, subiti dal clima e dalle intemperie nel corso del tempo: i modelli BIM (Building Information Modeling, è un sistema di progettazione che permette ad architetti ed ingegneri di creare costruzioni virtuali) infatti possono essere aggiornati molto più rapidamente grazie all’inserimento di sensori collocati negli edifici finiti, permettendo di programmare in maniera precisa e tempestiva eventuali interventi di manutenzione (Big Data e Internet of things (IoT) nella filiera delle costruzioni | Studio Tecnico Geometra Alessandro Napolitano (tecnostudionapolitano.it))
Infine, grazie ai Big Data e all’AI è possibile programmare i tempi di vendemmia e costruire dei robot che girano tra i filari e verificano lo stato dell’uva.
3. Settore bancario, finanziario e sanitario.
In questo settore i dati rappresentano un input fondamentale per quanto riguarda l’analisi del mercato per le imprese e le società di consulenza. E’ inoltre possibile studiare delle correlazioni per capire se un soggetto che richiede una carta di credito è finanziariamente affidabile o meno.
Rientrano in questo settore gli ambiti della salute, della farmaceutica e della medicina. Alcuni esempi pratici sono i dispositivi di monitoraggio remoto, la personalizzazione di ausili e tutor intelligenti che si attivano in tempo reale.
4. Settore della Sentiment Analysis.
La Sentiment Analysis procede analizzando commenti, tweets, frasi digitate su Google e così via, in modo da fornire alle aziende la percezione generale che i clienti hanno del brand. Questo è molto utile ad esempio quando parliamo di Personal Branding, un tema che abbiamo approfondito nel nostro blog in questo articolo.
Big Data: quali sono le sfide per il futuro?
La challenge per un futuro non poi così lontano è sicuramente giungere al corretto bilanciamento tra utilità ed etica, in modo tale che i Big Data possano essere sfruttati in maniera vantaggiosa ma adatta a noi, senza che nessuno si senta invaso nella sua privacy.
I Big Data infatti sembrano provocare problemi negli ambiti della sicurezza in rete, della manipolazione delle informazioni sul web con lo scopo ad esempio di influenzare campagne elettorali e scelte dei cittadini (basti pensare al caos mediatico in seguito alla richiesta ai cittadini italiani di scaricare l’app Immuni!).
Inoltre, data la voluminosità di queste enormi quantità di dati, un’altra sfida per le prossime generazioni sarà sicuramente quella di sviluppare nuove tecniche per lo storage di queste informazioni digitali, in modo tale che possano essere più semplici da memorizzare ed analizzare.
Ora che hai capito cosa sono i Big Data, quale pensi che sarà l’impatto più significativo che avranno in futuro? Pensi che i Big Data siano un problema per la nostra privacy? Siamo curiosi di sapere la tua opinione! Ti aspettiamo sui nostri social.
Sei bloccato con il tuo argomento di tesi? Thesis 4u Consulting è qui per te, andiamo avanti insieme! Prenota una prima consulenza gratuita tramite il nostro calendly!
About the author: Camilla, Blog Ambassador
About the sources:
Video:
- https://www.youtube.com/watch?v=j-0cUmUyb-Y&t=292s
- https://www.youtube.com/watch?v=meTfgz-vR5w&t=5s
- https://www.youtube.com/watch?v=bAyrObl7TYE
- https://www.youtube.com/watch?v=LmoslNG24IE&t=1s
- https://www.youtube.com/watch?v=36roiXQ38uk&t=810s
- https://www.youtube.com/watch?v=BAkVWqs4GyA&t=2s
Articoli: