Sügavõppe alused
Õpieesmärgid
Pärast selle peatüki läbimist oskate:
- Määratleda sügavõpet ja selgitada selle seost masinõppega.
- Kirjeldada närvivõrgu põhistruktuuri.
- Mõista võrgu kihtide (sisend-, peidetud-, väljundkiht) kontseptsiooni.
- Tuvastada sügavõppe levinud rakendusi igapäevaelus.
- Selgitada sügavõppe piiranguid, nagu andme- ja arvutusvajadused.
Mõiste ja seos masinõppega
Sügavõpe on spetsialiseerunud masinõppe alavaldkond, mis keskendub tehisintellekti algoritmidele, mis on inspireeritud inimese aju struktuurist ja funktsioonist. Neid algoritme tuntakse ka kui tehisnärvivõrgud. Sügavõppe kohta tehisintellekti hierarhias on lihtne aru saada, kui vaatame seda kui spetsiifilist osa laiemast tervikust:
- Tehisintellekt: Laialdane valdkond, mis loob süsteeme, mis suudavad jäljendada inimintellekti.
- Masinõpe: AI alamhulk, kus algoritmid õpivad andmetest mustreid leidma, ilma et neid oleks programmeeritud iga ülesande jaoks eraldi.
- Sügavõpe: ML alamhulk, mis kasutab sügavaid ehk mitmekihilisi närvivõrke.
Närvivõrkude põhitõed
Sügavõppe keskmes on närvivõrgud, mis koosnevad paljudest väikestest arvutusüksustest – tehisneuronitest. Et paremini mõista, kuidas need võrgud töötavad, vaatame esmalt, mis on üksik neuron ja seejärel, kuidas neuronid moodustavad kihid.
Mis on tehisneuron?
Tehisneuronid on matemaatilised mudelid, mis on inspireeritud inimese ajus olevatest bioloogilistest neuronitest. Bioloogiline neuron on ajurakk, mis saab signaale teistelt rakkudelt, töötleb neid ja edastab omakorda edasi. Tehisneuron teeb sarnast asja, kuid arvutuse kujul – ta võtab vastu arvulised väärtused, kombineerib neid ja annab väljundi.
Iga tehisneuron täidab järgmisi põhiülesandeid:
- Sisendid – need on arvulised andmed või tunnused, mis neuronisse sisestatakse. Näiteks võib sisend olla pildi piksliväärtus või inimese vanus andmetabelis.
- Kaalud – iga sisendiga on seotud kaal, mis näitab, kui tähtis see sisend on. Kui kaal on suurem, mõjutab see tulemust rohkem.
- Summeerimine – neuron korrutab iga sisendi tema kaaluga ning liidab tulemused kokku. See on nagu kaalutud keskmise leidmine.
- Aktivatsioonifunktsioon – see on matemaatiline „lüliti“, mis otsustab, millisel kujul väljund antakse.
See muudab mudeli paindlikuks ja võimaldab tal õppida ka keerukaid mustreid. Levinud aktivatsioonifunktsioonid on näiteks:
- ReLU (Rectified Linear Unit) – laseb positiivsed väärtused läbi, aga negatiivsed asendab nulliga.
- Sigmoid – muudab kõik väärtused vahemikku 0–1, sobib tõenäosuste väljendamiseks.
Seega võib tehisneuronit vaadelda kui väikest arvutusüksust, mis teeb otsuse oma sisendite põhjal.
Kuidas neuronid moodustavad võrke?
Üksik neuron on küll lihtne, aga närvivõrk tekib siis, kui neid ühendada paljudeks kihtideks:
- Sisendkiht – võtab vastu algandmed (nt pildi pikslid või helisignaali).
- Peidetud kihid – mitmed järjestikused kihid, kus neuronid töötlevad andmeid ja tuvastavad üha keerulisemaid mustreid. Näiteks võib esimene peidetud kiht eristada pildil sirgjooni, järgmine kiht ringe ja veel järgmine terviklikke objekte.
- Väljundkiht – annab lõpliku vastuse või ennustuse, näiteks „see on kass“.
Mida rohkem kihte ja neuroneid, seda „sügavam“ on võrk – siit tuleneb ka mõiste sügavõpe. Tänu sellisele kihilisele struktuurile suudavad närvivõrgud õppida ülesandeid, mida varasemad masinõppemeetodid ei suutnud, nagu kõne äratundmine või keeruliste piltide klassifitseerimine.
Sügavõppe rakendused
Sügavõpe on paljude igapäevaelus kasutatavate tehnoloogiate alustala:
- Pildituvastus: Kasutatakse meditsiinilises diagnostikas, isesõitvates autodes ja näotuvastussüsteemides.
- Kõne tekstiks muutmine: Võimaldab häälabilistel (nt Siri, Google Assistant) muuta suulist kõnet kirjalikuks tekstiks.
- Masintõlge: Tagab automaatse keele tõlkimise, mida kasutavad sellised teenused nagu Google Translate.
Nendes rakendustes teisendatakse algandmed (nt foto või helisalvestis) automaatselt soovitud väljundiks, demonstreerides sügavõppe võimet õppida otse andmetest, ilma et inimene peaks iga reegli selgesõnaliselt paika panema.
Sügavõppe piirangud
Vaatamata oma võimsusele on sügavõppel olulisi piiranguid, mis takistavad selle universaalset kasutamist:
- Andmevajadus: Efektiivseks treenimiseks on vaja tohutul hulgal märgistatud andmeid, mille kogumine on aeganõudev ja kallis.
- Arvutusvõimsus: Sügavate võrkude treenimine nõuab suurt arvutusvõimsust, mille tagamiseks kasutatakse spetsiaalseid protsessoreid (GPU-d ja TPU-d).
- Selgitatavus: Närvivõrgud on sageli nn „mustad kastid“ oma varjatud mehhanismidega, mis teeb keeruliseks nende otsuste selgitamise või põhjendamise.
- Üleõppimine: Võrk võib õppida treeningandmed liiga hästi pähe, kaotades seeläbi võime uusi andmeid üldistada ja neid edukalt töödelda.
Need väljakutsed on olulised, sest need näitavad, miks sügavõpe ei ole alati parim valik ja miks teadlased jätkuvalt otsivad efektiivsemaid ja selgitatavamaid lahendusi.
Kokkuvõte
Sügavõpe on masinõppe alamhulk, mis omakorda kuulub tehisintellekti alla. Selle aluseks on neuronitest ehitatud närvivõrgud, mis töötlevad andmeid mitmes kihis. Rakendused ulatuvad pildituvastusest masintõlkeni, näidates sügavõppe laialdast potentsiaali. Samas on oluline meeles pidada selle piiranguid, sealhulgas suurt andmevajadust ja arvutusnõudlust.