Tehisintellekt igapäevaelus
Õpieesmärgid
Selle peatüki lõpuks oskate:
- Tuvastada konkreetseid näiteid generatiivsete ja mitetegeneratiivsete TI rakenduste kohta
- Mõista, kuidas hübriidsed TI-süsteemid kombineerivad mõlemat lähenemisviisi, kasutades konkreetseid näiteid.
- Vaadata GAN-e (Generative Adversarial Networks) tegevust nende väljundite kaudu.
Selles peatükis uurime eelnevalt käsitletud AI-tüüpide rakendusi reaalses elus. Konkreetsete näidete vaatamine aitab kinnistada arusaama sellest, kuidas generatiivsed, mittegeneratiivsed ja hübriidsed AI-süsteemid praktikas toimivad.
Generatiivse tehisintellekti näited
Eelmisest peatükist selgus, et generatiivne tehisintellekt loob uut sisu. Allpool on toodud mõningad tuntumad loomingulised rakendused, mis on osutunud nii kasulikuks kui populaarseks:
-
Teksti loomine:
- ChatGPT (OpenAI): laialdaselt tuntud suur keelemudel, mis suudab genereerida inimlikku teksti vestluste, artiklite, loomingulise kirjutamise ja muuks otstarbeks.
- Google Gemini: Google'i võimas tehisintellekti mudelite perekond, mis oskab töötada korraga erinevat tüüpi informatsiooniga ja luua mitmesugust sisu, sealhulgas teksti.
- Claude (Anthropic): veel üks keelemudel, mis on loodud selleks, et kirjutada abistavat, ohutut ja tõepärast teksti.
-
Piltide genereerimine:
- DALL·E 3 (OpenAI): loob tekstikirjelduste põhjal kõrgekvaliteedilisi pilte, mis on sageli loomingulised ja detailiderohked.
- Midjourney: tuntud oma kunstiliste ja tihti fantaasiarohkete piltide poolest, eriti populaarne digitaalkunstnike seas.
- Stable Diffusion: avatud lähtekoodiga mudel, mis oskab genereerida pilte tekstist ning muuta ja täiendada olemasolevaid pilte.
-
Muusika loomine:
- Soundraw: TI-muusikageneraator, mis võimaldab kasutajatel valida soovitud meeleolu, žanri ja instrumendid, et luua just sellist (tausta)muusikat, mis vaja.
- AIVA (Artificial Intelligence Virtual Artist): spetsialiseerunud emotsionaalse muusika loomisele, mis sobib filmide, mängude või reklaamide jaoks.
-
Koodi genereerimine:
- GitHub Copilot: see tööriist toimib nagu abiline programmeerimisel, pakkudes koodiridu või terviklikke funktsioone kirjutamise ajal, olles õppinud tohutul hulgal avalikult kättesaadavast koodist.
- Code Llama (Meta): suur keelemudel, mis on spetsiaalselt häälestatud koodi genereerimiseks ja mõistmiseks.
-
3D-mudelite genereerimine:
- DreamFusion (Google): suudab luua 3D-mudeleid tekstikirjelduste põhjal, avades uusi võimalusi mängude arendamiseks ja virtuaalreaalsuseks.
Mittegeneratiivse tehisintellekti näited
Erinevalt generatiivsest TI-st, mis loob midagi uut (nt teksti või pilte), keskendub mittegeneratiivne TI olemasolevate andmete analüüsile. See tähendab, et süsteem õpib ära mustrid ja reeglid, et aidata meil teha targemaid otsuseid või avastada midagi olulist.
Sellist tehnoloogiat kohtame igapäevaselt, tihti isegi märkamata. Allpool toome näiteid, kuidas see meie elu lihtsustab.
-
Klassifitseerimine ja filtreerimine:
- E-posti rämpsposti filtrid: Gmaili või Outlooki TI analüüsib e-kirju (märksõnad, saatja taust), et eraldada rämpspost, säästes sinu aega.
- Sisu modereerimise sotsiaalmeedias: Platvormid nagu Facebook või Twitter (praegune X) kasutavad TI-d sobimatu sisu (vihakõne, vägivald) tuvastamiseks ja eemaldamiseks.
-
Soovitussüsteemid:
- Netflixi soovituste mootor: analüüsib vaatamisajalugu, hinnanguid ja eelistusi (ning sarnaste kasutajate omi), et soovitada personaalselt filme ja telesaateid.
- Spotify Discover Weekly/Daily Mixes: koostab isikupärastatud muusikapleilistid kasutaja kuulamisharjumuste ja muusikamaitse põhjal.
- Amazoni tootesoovitused: soovitab tooteid sirvimisajaloo, varasemate ostude ja teiste klientide vaadatud toodete põhjal.
-
Avastamine ja ennustamine:
- Krediitkaardipettuste avastamine: TI-mudelid, mis jälgivad miljoneid tehinguid reaalajas, tuvastades kahtlaseid mustreid, mis võiksid viidata pettustele.
- Näotuvastus (nt Apple Face ID): TI, mis tuvastab või kontrollib isikuid, analüüsides nende näojoonte mustreid.
- Meditsiinilise diagnoosi toetamine (nt Google DeepMindi AI silmahaiguste avastamiseks): TI analüüsib meditsiinilisi pilte (nt võrkkesta skaneeringud, röntgenülesvõtted), et aidata avastada haigusi või kõrvalekaldeid.
- Ennetav hooldus (nt tootmises, lennunduses): TI, mis analüüsib masinate andureid, et ennustada võimalikke rikkeid ja planeerida ennetavat hooldust.
Hübriidsed TI-süsteemid ja GAN-id
Paljud võimsad tehisintellekti rakendused kombineerivad generatiivseid ja mittegeneratiivseid võimeid. Vaatame, kuidas need hübriidsüsteemid töötavad ja kus neid kasutatakse.
-
Masintõlge (nt Google Translate, DeepL):
- Mittegeneratiivne osa: analüüsib teksti grammatikat ja tähendust.
- Generatiivne osa: loob sihtkeeles uue teksti, mis kannab sama mõtet.
-
TI-põhine kokkuvõtmine (nt QuillBot, Jasper.ai kokkuvõtja):
- Mittegeneratiivne osa: tuvastab teksti põhiideed ja võtmesõnad.
- Genereeriv osa: kirjutab need ümber terviklikuks lühikokkuvõtteks.
-
Stiili ülekandmine piltidele (nt Prisma rakendus):
- Mittegenereeriv osa: analüüsib algse pildi kunstilist stiili.
- Genereeriv osa: rakendab tuvastatud stiili uuele pildile, luues originaalse kunstilise tulemuse.
-
Generatiivsed vastandlikud võrgustikud (GAN): GAN on suurepärane näide hübriidsüsteemist, kus kaks tehisintellekti (generaator ja diskriminaator) töötavad vastamisi, et luua väga realistlikku sisu.
-
Realistlike nägude genereerimine (nt NVIDIA StyleGAN): GAN-e on kasutatud uskumatult tõetruude, täiesti tehislike inimnägude loomiseks. Generaator loob nägusid ja diskriminaator püüab eristada neid päris nägudest.
-
Süvavõltsingud: Kuigi deepfake-tehnoloogiat on kuritarvitatud, kasutab see GAN-e realistlike videote või helide loomiseks, asendades või muutes inimese nägu või häält, tihti olemasoleva materjali põhjal.
-
Pildi-pildiks tõlkimine (nt Pix2Pix, CycleGAN): Need GAN-id suudavad teisendada pilte ühest valdkonnast teise, näiteks muuta visandid fotorealistlikeks piltideks või suvised stseenid talvisteks.
-
Kokkuvõte
Tehisintellekti süsteemid on saanud meie igapäevaelu lahutamatuks osaks, alates loomingulise sisu loomisest kuni oluliste otsuste tegemiseni.
Kui mõistame generatiivsete ja mittegeneratiivsete tehisintellektide erinevaid ülesandeid ning seda, kuidas need tihti ühinevad võimsateks hübriidsüsteemideks nagu GAN-id, suudame paremini hinnata selle kiiresti areneva valdkonna keerukust ja võimalusi.