Cos’è il machine learning e per cosa si utilizza

Home/Data Science, Machine learning/Cos’è il machine learning e per cosa si utilizza

Il machine learning è diffuso in tantissime applicazioni che utilizziamo tutti i giorni. Grandi aziende, come Amazon, Netflix, Google, Apple e Facebook utilizzano gli algoritmi di machine learning per i più svariati fini. Ad esempio, Facebook utilizza il machine learning per il riconoscimento dei volti nelle immagini; Amazon e Netflix analizzano i gusti dei clienti (ultime cose viste o acquistate) per proporci nuovi prodotti o nuovi film da vedere. 

Google utilizza il machine learning nell’ambito delle traduzioni e degli spostamenti, suggerendoci una strada meno trafficata in base alle nostre abitudini e al posto dove siamo soliti andare in un dato giorno della settimana, ma ci aiuta anche a discernere tra le nostre email quelle che sono spam da quelle che non lo sono, utilizzando spesso metodi probabilistici o comunque unendo più metodi (ad esempio l’analisi di mail che sono spam, e non spam sulla base dei termini che le compongono, più regole decise dall’utente).

Apple e Microsoft utilizzano il machine learning per fornirci un assistente vocale che possa aiutarci a utilizzare un telefono o un tablet con il solo uso della nostra voce, magari quando siamo alla guida. Altre aziende al momento perfezionano tramite metodi di intelligenza artificiale, la guida automatica.

L’area di studi relativa al machine learning venne portata all’attenzione di un pubblico più vasto quando all’interno del programma televisivo Jeopardy!, basato sul formato del quiz a premi, venne fatto gareggiare nel 2011 un supercomputer, Watson, sviluppato da IBM. 

Il machine learning è stato utilizzato anche per predire i risultati delle elezioni, in primis dal data scientist Nate Silver, che nel mese di Ottobre del 2012 pubblicò sul proprio sito una previsione dei risultati delle elezioni statunitensi, con risultati molto vicini a quelli effettivi. 

Il data mining predittivo, che è un altro nome per machine learning, viene anche utilizzato in ambito sanitario. Lo studio dei dati relativi ai pazienti e alle cartelle cliniche permette infatti di identificare le persone che sono più a rischio di contrarre determinate patologie, come il diabete, oppure di andare incontro a problemi cardiaci. L’analisi del dna e dei corredi genetici è stata utilizzata ad esempio per individuare dei geni responsabili o comunque correlati ad alcuni tipi di cancro, ad esempio per prevedere l’insorgenza del cancro al seno.

Uno degli ambiti di utilizzo più ‘anziani’ è invece il riconoscimento della scrittura a a mano, in particolare degli indirizzi e dei codici di avviamento postale scritti a mano sulle lettere. In questo caso il riconoscimento avviene sulla base di varie occorrenze di ogni numero scritte a mano grazie all’utilizzo dei network neurali, ed è dovuto agli studi dei Bell Labs. 

La ricerca nell’ambito del machine learning e di alcuni temi ad esso connessi, come deep learning e intelligenza artificiale, fa passi avanti ogni giorno ed è uno dei temi più importanti in questo momento. Alcuni siti, come Kaggle, pubblicano ogni pochi giorni concorsi dove viene pubblicato un problema e gli iscritti possono tentare di dare una soluzione. Il concorso più famoso su Kaggle è stato bandito da Netflix che nel 2006 ha messo in palio 1 milione di dollari per un sistema di raccomandazione. Sebbene il premio sia stato attribuito, il sistema sviluppato non è stato però implementato effettivamente da Netflix perché troppo complesso e computazionalmente oneroso. 

Due linguaggi di programmazione molto usati nel machine learning sono R e Python, che sono i due linguaggi chiave quando si parla di analisi dati. Alcune piattaforme per il data mining, come ad esempio Rapidminer e Weka, sono invece  basate su Java.

About the Author:

Leave A Comment