Învățare supravegheată: Cum să învățați mașinile să ne ajute

Publicat: 2021-02-11

Vă puteți gândi la învățarea supravegheată ca la un profesor care supraveghează întregul proces de învățare.

Este unul dintre cele mai comune moduri în care mașinile învață și este un instrument de neprețuit în domeniul inteligenței artificiale. Acest proces de învățare este comparabil cu o relație elev-profesor, deși mașinile nu sunt la fel de încăpățânate ca oamenii.

Dacă tocmai ați pășit în lumea inteligenței artificiale, învățarea supravegheată ar putea să nu fie un termen pe care l-ați întâlnit anterior. Pe scurt, este o strategie de învățare automată care permite sistemelor AI să învețe și să progreseze.

Ce este învățarea supravegheată?

Învățarea supravegheată este o subcategorie a învățării automate care utilizează seturi de date etichetate pentru a antrena algoritmi. Este o abordare de învățare automată în care programului i se oferă date de intrare etichetate împreună cu rezultatele așteptate.

Mai simplu spus, algoritmii de învățare supravegheată sunt proiectați să învețe prin exemplu. Astfel de exemple sunt denumite date de antrenament și fiecare exemplu este o pereche de obiect de intrare și valoarea de ieșire dorită. Perechea de date de intrare și de ieșire introduse în sistem este denumită în general date etichetate .

Prin introducerea datelor etichetate, arătați unui aparat conexiunile dintre diferite variabile și rezultatele cunoscute. În cazul învățării supravegheate, sistemului AI i se spune în mod explicit ce să caute în datele de intrare date. Acest lucru le permite algoritmilor să se îmbunătățească periodic și să creeze modele de învățare automată care pot prezice rezultatele sau pot clasifica datele cu acuratețe atunci când sunt prezentate cu date necunoscute.

În general, trei seturi de date sunt utilizate în diferite etape ale procesului de creare a modelului:

Setul de date de antrenament: eșantionul de date utilizat pentru antrenamentul modelului. Cu alte cuvinte, este un set de exemple de antrenament utilizate pentru a se potrivi parametrilor modelului.
Setul de date de validare: eșantionul de date utilizat pentru a oferi o evaluare imparțială a potrivirii unui model pe setul de date de antrenament
Set de date de testare: eșantionul de date utilizat pentru a oferi o evaluare imparțială a unui model final de potrivire pe setul de date de antrenament

Potrivirea modelului se referă la măsura în care modelul se generalizează la date similare cu cele pe care a fost antrenat. Un model bine adaptat produce rezultate precise; un model supraadaptat se potrivește prea mult cu datele; un model insuficient montat nu se potrivește suficient de mult cu datele.

Cum funcționează învățarea supravegheată?

Formarea joacă un rol esențial în învățarea supravegheată. În timpul fazei de antrenament, sistemul AI este alimentat cu volume mari de date de antrenament etichetate. După cum sa menționat anterior, datele de antrenament instruiesc sistemul despre cum ar trebui să fie rezultatul dorit de la fiecare valoare de intrare distinctă.

Modelul antrenat primește apoi datele de testare . Acest lucru le permite oamenilor de știință să determine eficacitatea antrenamentului și acuratețea modelului. Precizia unui model depinde de dimensiunea și calitatea setului de date de antrenament și de algoritmul utilizat.

Cu toate acestea, precizia ridicată nu este întotdeauna un lucru bun. De exemplu, precizia ridicată ar putea însemna că modelul suferă de supraadaptare - o eroare de modelare sau optimizarea incorectă a unui model atunci când este reglat excesiv la setul de date de antrenament și poate duce chiar la rezultate false pozitive.

Într-o astfel de situație, modelul ar putea funcționa remarcabil de bine în scenariile de testare, dar ar putea eșua să ofere rezultate corecte în circumstanțe reale. Pentru a eradica șansele de supraadaptare, asigurați-vă că datele de testare sunt complet diferite de datele de antrenament. De asemenea, verificați dacă modelul nu trage răspunsuri din experiența anterioară.

Exemplele de instruire ar trebui să fie, de asemenea, diverse. În caz contrar, atunci când sunt prezentate cazuri nemaivăzute până acum, modelul nu va funcționa.

În contextul științei datelor și extragerii datelor (procesul de transformare a datelor brute în informații utile), învățarea supravegheată poate fi împărțită în două tipuri: clasificare și regresie .

Un algoritm de clasificare încearcă să determine categoria sau clasa datelor cu care sunt prezentate. Clasificarea spam-ului prin e-mail, viziunea computerizată și clasificarea medicamentelor sunt câteva dintre exemplele comune de probleme de clasificare.

Pe de altă parte, algoritmii de regresie încearcă să prezică valoarea de ieșire pe baza caracteristicilor de intrare ale datelor furnizate. Predicția ratelor de clic ale reclamelor digitale și estimarea prețului unei case pe baza caracteristicilor sale sunt câteva dintre problemele comune de regresie.

Învățare supravegheată vs. nesupravegheată vs. semi-supravegheată

Una dintre cele mai bune modalități de a înțelege diferența dintre învățarea supravegheată și nesupravegheată este să vă uitați la modul în care ați învăța să jucați un joc de masă – să spunem șah.

învățare supravegheată vs. nesupravegheată vs. învățare semisupravegheată

O opțiune este să angajezi un tutor de șah. Un tutore vă va învăța cum să jucați jocul de șah, explicându-vă regulile de bază, ce face fiecare piesă de șah și multe altele. Odată ce ești conștient de regulile jocului și de scopul fiecărei piese, poți continua și exersa jucând împotriva tutorelui.

Profesorul vă va supraveghea mișcările și vă va corecta ori de câte ori faceți greșeli. Odată ce ai adunat suficiente cunoștințe și exersare, poți începe să joci competitiv împotriva altora.

Acest proces de învățare este comparabil cu învățarea supravegheată . În învățarea supravegheată, un cercetător de date acționează ca un tutore și antrenează mașina, alimentând regulile de bază și strategia generală.

Dacă nu doriți să angajați un tutore, puteți învăța în continuare jocul de șah. O modalitate este să-i vezi pe ceilalți cum joacă jocul. Probabil că nu le puteți pune întrebări, dar puteți urmări și învăța cum să jucați jocul.

În ciuda faptului că nu cunoașteți numele fiecărei piese de șah, puteți afla cum se mișcă fiecare piesă observând jocul. Cu cât vizionezi mai multe jocuri, cu atât înțelegi mai bine și devii mai informat despre diferitele strategii pe care le poți adopta pentru a câștiga.

Acest proces de învățare este similar învățării nesupravegheate . Savantul de date permite mașinii să învețe observând. Deși aparatul nu cunoaște numele sau etichetele specifice, va putea găsi modele pe cont propriu.

Mai simplu spus, învățarea nesupravegheată este atunci când unui algoritm i se oferă un set de date de antrenament care conține doar datele de intrare și nicio dată de ieșire corespunzătoare.

După cum puteți vedea, ambele metode de învățare au puncte forte și puncte slabe notabile.

Pentru învățarea supravegheată, aveți nevoie de un tutore cu cunoștințe care ar putea preda mașinii regulile și strategia. În exemplul șahului, aceasta înseamnă că aveți nevoie de un tutore pentru a învăța jocul. Dacă nu, ai putea ajunge să înveți jocul greșit.

În cazul învățării nesupravegheate, aveți nevoie de volume mari de date pentru ca mașina să le observe și să învețe. Deși datele neetichetate sunt ieftine (și abundente) și ușor de colectat și stocat, acestea trebuie să fie lipsite de date duplicat sau de gunoi. Datele greșite sau incomplete pot duce, de asemenea, la prejudecăți de învățare automată – un fenomen în care algoritmii produc rezultate discriminatorii.

În exemplul șahului, dacă înveți observând alți jucători, asta înseamnă că trebuie să urmărești zeci de jocuri înainte de a înțelege. De asemenea, dacă urmăriți jucători care joacă incorect jocul, puteți ajunge să faceți același lucru.

Apoi, există învățarea semi-supravegheată .

După cum probabil ați ghicit, învățarea semi-supravegheată este o combinație de învățare supravegheată și nesupravegheată. În acest proces de învățare, un cercetător de date antrenează mașina doar puțin, astfel încât să obțină o imagine de ansamblu la nivel înalt. Mașina învață apoi regulile și strategia observând tipare. Un mic procent din datele de antrenament vor fi etichetate, iar restul vor fi neetichetate.

În exemplul învățării șahului, învățarea semi-supravegheată ar fi similară cu un tutore care vă explică doar elementele de bază și vă permite să învățați jucând competitiv.

Un alt proces de învățare este învățarea prin întărire (RL) . Este o strategie de învățare automată în care un sistem AI se confruntă cu o situație asemănătoare unui joc. Pentru a preda AI, un programator folosește o tehnică recompensă-penalizare, în care sistemul trebuie să se concentreze pe luarea de acțiuni adecvate pentru a maximiza recompensa și a evita penalitățile.

Algoritmi de învățare supravegheați

Numeroase tehnici de calcul și algoritmi sunt utilizați în procesul de învățare supravegheată.

Atunci când alegeți un algoritm de învățare automată supravegheat, sunt luați în considerare, în general, următorii factori:

Complexitatea modelului pe care sistemul încearcă să-l învețe
Bias și varianță care există în cadrul algoritmului
Dimensiunea datelor de antrenament
Acuratețea, eterogenitatea, redundanța și liniaritatea datelor
Timp disponibil pentru antrenament

Iată câțiva dintre algoritmii obișnuiți de învățare automată supravegheată pe care îi veți întâlni.

Regresie liniara

Regresia liniară este atât un algoritm statistic, cât și un algoritm de învățare automată. Este un algoritm care încearcă să modeleze relația dintre două variabile atașând o ecuație liniară la datele observate. Dintre cele două variabile, una este considerată a fi o variabilă explicativă, iar cealaltă o variabilă dependentă.

Regresia liniară poate fi folosită și pentru a identifica relația dintre o variabilă dependentă și una sau mai multe variabile independente. În domeniul învățării automate, regresia liniară este folosită pentru a face predicții.

Regresie logistică

Regresia logistică este un model matematic utilizat pentru a estima probabilitatea unui eveniment pe baza datelor anterioare furnizate. Scorul de credit și detectarea fraudei tranzacțiilor online sunt câteva dintre aplicațiile din lumea reală ale acestui algoritm. Cu alte cuvinte, este un algoritm de analiză predictivă bazat pe conceptele de probabilitate utilizate pentru rezolvarea problemelor de clasificare binară.

La fel ca regresia logistică, și regresia liniară a fost împrumutată din domeniul statisticii. Totuși, spre deosebire de regresia liniară care funcționează cu variabile dependente continue, regresia logistică funcționează cu date binare, cum ar fi „adevărat” sau „fals”.

Rețele neuronale

Rețelele neuronale artificiale (ANN) sunt utilizate în principal de algoritmii de învățare profundă. Sunt o serie de algoritmi care imită funcțiile creierului uman pentru a recunoaște relațiile dintre volume mari de date. După cum probabil ați ghicit, ANN-urile sunt esențiale pentru sistemele de inteligență artificială.

Rețelele neuronale sunt formate din straturi de mai multe noduri. Fiecare nod este format din intrări, ponderi, părtinire și ieșiri. Un ANN este antrenat prin ajustarea ponderilor de intrare în funcție de performanța rețelei. De exemplu, dacă rețeaua neuronală clasifică corect o imagine, ponderile care contribuie la răspunsul corect sunt crescute, în timp ce celelalte ponderi sunt reduse.

Bayes naiv

Naive Bayes este o metodă de clasificare bazată pe principiul independenței condiționale de clasă al teoremei Bayes. În termeni mai simpli, abordarea clasificatorului Naive Bayes presupune că prezența unei caracteristici specifice într-o clasă nu influențează prezența vreunei alte caracteristici.

De exemplu, un fruct poate fi considerat a fi un măr dacă este de culoare roșie, rotund și cu un diametru de aproximativ trei centimetri. Chiar dacă aceste caracteristici depind unele de altele, toate aceste proprietăți contribuie individual la probabilitatea ca însuși fructul să fie un măr.

Modelul Naive Bayes este util atunci când aveți de-a face cu seturi de date mari. Este ușor de construit, rapid și este cunoscut că funcționează chiar mai bine decât metodele avansate de clasificare.

Mașină vectorială de suport (SVM)

Mașină vectorială de suport (SVM) este un algoritm de învățare automată supravegheat bine-cunoscut dezvoltat de Vladimir Vapnik. În ciuda faptului că sunt utilizate în principal pentru probleme de clasificare, SVM-urile pot fi utilizate și pentru regresie.

SVM-urile sunt construite pe ideea de a găsi un hiperplan care împarte cel mai bine un anumit set de date în două clase. Un astfel de hiperplan este denumit graniță de decizie și separă punctele de date în ambele părți. Detectarea feței, categorizarea textului, clasificarea imaginilor sunt câteva dintre numeroasele aplicații din lumea reală ale SVM.

K-cei mai apropiați vecini (KNN)

Algoritmul K-nearest neighbors (KNN) este un algoritm de învățare automată supravegheat folosit pentru a rezolva probleme de regresie și clasificare. Este un algoritm care grupează punctele de date în funcție de apropierea și relația lor cu alte date.

Este ușor de înțeles, simplu de implementat și are un timp de calcul redus. Cu toate acestea, algoritmul devine considerabil lent pe măsură ce dimensiunea datelor utilizate crește. KNN este utilizat în general pentru sistemele de recunoaștere și recomandare a imaginilor.

pădure întâmplătoare

Pădurea aleatoare este o metodă de învățare care constă dintr-un număr mare de arbori de decizie care funcționează ca un ansamblu (folosirea unor algoritmi de învățare multipli pentru a obține performanțe predictive mai bune). Fiecare arbore de decizie oferă o predicție de clasă, iar clasa cu cele mai mari voturi devine predicția modelului.

Algoritmul forestier aleatoriu este utilizat pe scară largă în piața de valori, în domeniul bancar și în domeniul medical. De exemplu, poate fi folosit pentru a identifica clienții care au șanse mai mari să-și ramburseze datoria la timp.

Exemple de învățare supravegheată

După cum sa menționat anterior, predicția prețurilor caselor, ratele de clic ale reclamelor online și chiar disponibilitatea unui client de a plăti pentru un anumit produs sunt câteva dintre exemplele notabile de modele de învățare supravegheată.

Iată mai multe exemple pe care le-ai putea întâlni în viața de zi cu zi.

Analiza sentimentelor : o tehnică de procesare a limbajului natural utilizată pentru a determina sentimentul produsului și pentru a înțelege nevoile clienților
Recunoașterea imaginilor: o tehnică utilizată pentru a localiza, identifica și clasifica obiecte în videoclipuri și imagini
Detectarea spamului: metoda de clasificare a conținutului spam și non-spam prin recunoașterea tiparelor și anomaliilor în date

Învățarea mașinilor să gândească

Prin valorificarea datelor etichetate, algoritmii de învățare supravegheată pot crea modele care pot clasifica cu ușurință datele mari și chiar pot face predicții cu privire la rezultatele viitoare. Este o tehnică de învățare genială care introduce mașinile în lumea umană.

Vorbind despre tehnici de învățare pentru a face mașinile inteligente, v-ați întrebat vreodată de ce sisteme de inteligență artificială avem astăzi sunt cu adevărat capabile? Dacă da, hrănește-ți curiozitatea citind mai multe despre AI îngust.