Apprendimento supervisionato: come insegnare alle macchine ad aiutarci

Pubblicato: 2021-02-11

Puoi pensare all'apprendimento supervisionato come a un insegnante che supervisiona l'intero processo di apprendimento.

È uno dei modi più comuni in cui le macchine apprendono ed è uno strumento prezioso nel campo dell'intelligenza artificiale. Questo processo di apprendimento è paragonabile a una relazione studente-insegnante, sebbene le macchine non siano testarde come gli umani.

Se sei appena entrato nel mondo dell'intelligenza artificiale, l'apprendimento supervisionato potrebbe non essere un termine che hai incontrato in precedenza. In breve, è una strategia di apprendimento automatico che consente ai sistemi di intelligenza artificiale di apprendere e progredire.

Che cos'è l'apprendimento supervisionato?

L'apprendimento supervisionato è una sottocategoria dell'apprendimento automatico che utilizza set di dati etichettati per addestrare algoritmi. È un approccio di apprendimento automatico in cui al programma vengono forniti dati di input etichettati insieme ai risultati di output previsti.

In poche parole, gli algoritmi di apprendimento supervisionato sono progettati per imparare con l'esempio. Tali esempi sono indicati come dati di addestramento e ogni esempio è una coppia di un oggetto di input e il valore di output desiderato. La coppia di dati di input e output immessa nel sistema viene generalmente definita dati etichettati .

Alimentando dati etichettati, mostri a una macchina le connessioni tra diverse variabili e risultati noti. Con l'apprendimento supervisionato, al sistema di intelligenza artificiale viene detto esplicitamente cosa cercare nei dati di input forniti. Ciò consente agli algoritmi di migliorare periodicamente e creare modelli di apprendimento automatico in grado di prevedere i risultati o classificare i dati in modo accurato quando presentati con dati non familiari.

In genere, vengono utilizzati tre set di dati in diverse fasi del processo di creazione del modello:

Set di dati di addestramento: i dati di esempio utilizzati per addestrare il modello. In altre parole, è un insieme di esempi di addestramento utilizzati per adattarsi ai parametri del modello.
Set di dati di convalida: i dati di esempio utilizzati per fornire una valutazione imparziale di un adattamento del modello al set di dati di addestramento
Set di dati di test: i dati di esempio utilizzati per fornire una valutazione imparziale di un modello finale che si adatta al set di dati di addestramento

L'adattamento del modello si riferisce alla misura di quanto bene il modello si generalizza a dati simili a quelli su cui è stato addestrato. Un modello ben adattato produce risultati accurati; un modello sovradimensionato corrisponde ai dati troppo da vicino; un modello sottodimensionato non corrisponde abbastanza ai dati.

Come funziona l'apprendimento supervisionato?

La formazione gioca un ruolo fondamentale nell'apprendimento supervisionato. Durante la fase di addestramento, il sistema di intelligenza artificiale viene alimentato con enormi volumi di dati di addestramento etichettati. Come accennato in precedenza, i dati di addestramento istruiscono il sistema su come dovrebbe essere l'output desiderato da ciascun valore di input distinto.

Il modello addestrato riceve quindi i dati del test . Ciò consente ai data scientist di determinare l'efficacia della formazione e l'accuratezza del modello. L'accuratezza di un modello dipende dalle dimensioni e dalla qualità del set di dati di addestramento e dall'algoritmo utilizzato.

Tuttavia, un'elevata precisione non è sempre una buona cosa. Ad esempio, un'elevata precisione potrebbe significare che il modello soffre di un overfitting , un errore di modellazione o l'ottimizzazione errata di un modello quando viene sintonizzato eccessivamente sul suo set di dati di addestramento e potrebbe persino risultare in falsi positivi.

In tal caso, il modello potrebbe funzionare molto bene negli scenari di test, ma potrebbe non fornire un output corretto in circostanze del mondo reale. Per eliminare le possibilità di overfitting, assicurarsi che i dati del test siano completamente diversi dai dati dell'allenamento. Inoltre, controlla che il modello non tragga risposte dalla sua esperienza precedente.

Anche gli esempi di formazione dovrebbero essere diversi. In caso contrario, quando vengono presentati casi mai visti prima, il modello non funzionerà.

Nel contesto della scienza dei dati e del data mining (il processo di trasformazione dei dati grezzi in informazioni utili), l'apprendimento supervisionato può essere ulteriormente suddiviso in due tipi: classificazione e regressione .

Un algoritmo di classificazione tenta di determinare la categoria o la classe dei dati con cui viene presentato. La classificazione dello spam tramite posta elettronica, la visione artificiale e la classificazione dei farmaci sono alcuni degli esempi comuni di problemi di classificazione.

D'altra parte, gli algoritmi di regressione cercano di prevedere il valore di output in base alle caratteristiche di input dei dati forniti. Prevedere i tassi di clic degli annunci digitali e prevedere il prezzo di una casa in base alle sue caratteristiche sono alcuni dei problemi di regressione comuni.

Apprendimento supervisionato vs. non supervisionato vs. semi-supervisionato

Uno dei modi migliori per capire la differenza tra apprendimento supervisionato e non supervisionato è guardare come impareresti a giocare a un gioco da tavolo, diciamo a scacchi.

apprendimento supervisionato vs. non supervisionato vs. semi-supervisionato

Un'opzione è assumere un tutor di scacchi. Un tutor ti insegnerà a giocare a scacchi spiegandoti le regole di base, cosa fa ogni pezzo degli scacchi e altro ancora. Una volta che sei a conoscenza delle regole del gioco e della portata di ogni pezzo, puoi andare avanti ed esercitarti giocando contro il tutor.

Il tutor supervisionerà le tue mosse e ti correggerà ogni volta che commetti errori. Una volta che hai raccolto abbastanza conoscenze e pratica, puoi iniziare a giocare in modo competitivo contro gli altri.

Questo processo di apprendimento è paragonabile all'apprendimento supervisionato . Nell'apprendimento supervisionato, un data scientist agisce come un tutor e addestra la macchina alimentando le regole di base e la strategia generale.

Se non vuoi assumere un tutor, puoi comunque imparare il gioco degli scacchi. Un modo è guardare le altre persone giocare. Probabilmente non puoi porre loro domande, ma puoi guardare e imparare a giocare.

Nonostante non conosca i nomi di ogni pezzo degli scacchi, puoi imparare come si muove ogni pezzo osservando il gioco. Più giochi guardi, meglio capisci e più diventi informato sulle diverse strategie che puoi adottare per vincere.

Questo processo di apprendimento è simile all'apprendimento non supervisionato . Il data scientist consente alla macchina di apprendere osservando. Sebbene la macchina non conosca i nomi o le etichette specifici, sarà in grado di trovare i modelli da sola.

In poche parole, l'apprendimento non supervisionato si verifica quando a un algoritmo viene fornito un set di dati di addestramento che contiene solo i dati di input e nessun dato di output corrispondente.

Come puoi vedere, entrambi i metodi di apprendimento hanno notevoli punti di forza e di debolezza.

Per l'apprendimento supervisionato, è necessario un tutor esperto che possa insegnare alla macchina le regole e la strategia. Nell'esempio degli scacchi, questo significa che hai bisogno di un tutor per imparare il gioco. In caso contrario, potresti finire per imparare il gioco in modo errato.

Nel caso dell'apprendimento non supervisionato, sono necessari grandi volumi di dati per l'osservazione e l'apprendimento della macchina. Sebbene i dati senza etichetta siano economici (e abbondanti) e facili da raccogliere e archiviare, devono essere privi di dati duplicati o spazzatura. Dati imperfetti o incompleti possono anche causare pregiudizi di apprendimento automatico, un fenomeno in cui gli algoritmi producono risultati discriminatori.

Nell'esempio degli scacchi, se stai imparando osservando altri giocatori, significa che devi guardare dozzine di partite prima di capirlo. Inoltre, se stai guardando giocatori che giocano in modo errato, potresti finire per fare lo stesso.

Poi, c'è l' apprendimento semi-supervisionato .

Come avrai intuito, l'apprendimento semi-supervisionato è un mix di apprendimento supervisionato e non supervisionato. In questo processo di apprendimento, un data scientist addestra un po' la macchina in modo che ottenga una panoramica di alto livello. La macchina quindi apprende le regole e la strategia osservando i modelli. Una piccola percentuale dei dati di addestramento verrà etichettata e il resto sarà privo di etichetta.

Nell'esempio dell'apprendimento degli scacchi, l'apprendimento semi-supervisionato sarebbe simile a un tutor che ti spiega solo le basi e ti permette di imparare giocando in modo competitivo.

Un altro processo di apprendimento è l'apprendimento per rinforzo (RL) . È una strategia di apprendimento automatico in cui un sistema di intelligenza artificiale deve affrontare una situazione simile a un gioco. Per insegnare l'IA, un programmatore utilizza una tecnica di ricompensa-penalità, in cui il sistema deve concentrarsi sull'adozione di azioni adeguate per massimizzare la ricompensa ed evitare sanzioni.

Algoritmi di apprendimento supervisionato

Nel processo di apprendimento supervisionato vengono utilizzate numerose tecniche di calcolo e algoritmi.

Quando si sceglie un algoritmo di apprendimento automatico supervisionato, vengono generalmente considerati i seguenti fattori:

La complessità del modello che il sistema sta cercando di apprendere
Bias e varianza che esistono all'interno dell'algoritmo
Dimensione dei dati di allenamento
Precisione, eterogeneità, ridondanza e linearità dei dati
Tempo a disposizione per allenarsi

Ecco alcuni degli algoritmi di apprendimento automatico supervisionati comuni che incontrerai.

Regressione lineare

La regressione lineare è sia un algoritmo statistico che un algoritmo di apprendimento automatico. È un algoritmo che tenta di modellare la relazione tra due variabili allegando un'equazione lineare ai dati osservati. Delle due variabili, una è considerata una variabile esplicativa e l'altra una variabile dipendente.

La regressione lineare può essere utilizzata anche per identificare la relazione tra una variabile dipendente e una o più variabili indipendenti. Nel regno dell'apprendimento automatico, la regressione lineare viene utilizzata per fare previsioni.

Regressione logistica

La regressione logistica è un modello matematico utilizzato per stimare la probabilità di un evento sulla base dei dati precedenti forniti. Il credit scoring e il rilevamento delle frodi nelle transazioni online sono alcune delle applicazioni reali di questo algoritmo. In altre parole, è un algoritmo di analisi predittiva basato sui concetti di probabilità utilizzati per risolvere problemi di classificazione binaria.

Proprio come la regressione logistica, anche la regressione lineare è stata presa in prestito dal campo della statistica. Tuttavia, a differenza della regressione lineare che funziona con variabili dipendenti continue, la regressione logistica funziona con dati binari, come "vero" o "falso".

Reti neurali

Le reti neurali artificiali (ANN) sono utilizzate principalmente dagli algoritmi di deep learning. Sono una serie di algoritmi che imitano le funzioni del cervello umano per riconoscere le relazioni tra vasti volumi di dati. Come avrai intuito, le RNA sono fondamentali per i sistemi di intelligenza artificiale.

Le reti neurali sono costituite da strati di più nodi. Ogni nodo è costituito da input, pesi, bias e output. Un'ANN viene addestrata regolando i pesi di input in base alle prestazioni della rete. Ad esempio, se la rete neurale classifica correttamente un'immagine, i pesi che contribuiscono alla risposta corretta vengono aumentati mentre gli altri pesi vengono diminuiti.

Ingenuo Bayes

Naive Bayes è un metodo di classificazione basato sul principio dell'indipendenza condizionale di classe del teorema di Bayes. In termini più semplici, l'approccio classificatore di Naive Bayes presuppone che la presenza di una caratteristica specifica in una classe non influisca sulla presenza di altre caratteristiche.

Ad esempio, un frutto può essere considerato una mela se è di colore rosso, rotondo e di circa tre pollici di diametro. Anche se queste caratteristiche dipendono l'una dall'altra, tutte queste proprietà contribuiscono individualmente alla probabilità che il frutto stesso sia una mela.

Il modello Naive Bayes è utile quando si tratta di set di dati di grandi dimensioni. È facile da costruire, veloce ed è noto per funzionare anche meglio dei metodi di classificazione avanzati.

Supporta la macchina vettoriale (SVM)

Support Vector Machine (SVM) è un noto algoritmo di apprendimento automatico supervisionato sviluppato da Vladimir Vapnik. Nonostante siano utilizzate prevalentemente per problemi di classificazione, le SVM possono essere utilizzate anche per la regressione.

Le SVM si basano sull'idea di trovare un iperpiano che divida al meglio un determinato set di dati in due classi. Tale iperpiano viene definito confine decisionale e separa i punti dati in entrambi i lati. Il rilevamento dei volti, la categorizzazione del testo, la classificazione delle immagini sono alcune delle molte applicazioni reali di SVM.

K-vicini più vicini (KNN)

L'algoritmo K-nearest neighbors (KNN) è un algoritmo di apprendimento automatico supervisionato utilizzato per risolvere problemi di regressione e classificazione. È un algoritmo che raggruppa i punti dati in base alla loro vicinanza e relazione con altri dati.

È facile da capire, semplice da implementare e ha un basso tempo di calcolo. Tuttavia, l'algoritmo diventa notevolmente lento all'aumentare della dimensione dei dati in uso. KNN è generalmente utilizzato per i sistemi di riconoscimento e raccomandazione delle immagini.

Foresta casuale

La foresta casuale è un metodo di apprendimento costituito da un gran numero di alberi decisionali che operano come un insieme (l'uso di più algoritmi di apprendimento per ottenere migliori prestazioni predittive). Ciascun albero decisionale fornisce una previsione di classe e la classe con i voti più alti diventa la previsione del modello.

L'algoritmo della foresta casuale è ampiamente utilizzato nel mercato azionario, bancario e medico. Ad esempio, può essere utilizzato per identificare i clienti che hanno maggiori probabilità di rimborsare il debito in tempo.

Esempi di apprendimento supervisionato

Come accennato in precedenza, la previsione dei prezzi delle case, le percentuali di clic degli annunci online e persino la disponibilità di un cliente a pagare per un determinato prodotto sono alcuni degli esempi notevoli di modelli di apprendimento supervisionato.

Ecco altri esempi che potresti incontrare nella vita quotidiana.

Analisi del sentimento : una tecnica di elaborazione del linguaggio naturale utilizzata per determinare il sentimento del prodotto e comprendere le esigenze dei clienti
Riconoscimento delle immagini: una tecnica utilizzata per individuare, identificare e classificare oggetti in video e immagini
Rilevamento spam: il metodo per classificare i contenuti spam e non, riconoscendo schemi e anomalie nei dati

Insegnare alle macchine a pensare

Sfruttando i dati etichettati, gli algoritmi di apprendimento supervisionato possono creare modelli in grado di classificare facilmente i big data e persino fare previsioni sui risultati futuri. È una brillante tecnica di apprendimento che introduce le macchine nel mondo umano.

A proposito di tecniche di apprendimento per rendere intelligenti le macchine, vi siete mai chiesti di quali sistemi di intelligenza artificiale oggi siamo veramente capaci? In tal caso, alimenta la tua curiosità leggendo di più sull'IA ristretta.