30. novembril 2022 lansseeris San Franciscos paiknev tehisintellekti uurimislabor OpenAI vestlusroboti ChatGPT, mis on võimeline vastama päringutele intelligentsete vestluste kaudu ning genereerima seeläbi inimestele lihtsasti mõistetavat sisu. ChatGPT spontaansus ja dünaamiline iseloom on teinud sellest tõelise hiti, mille põhjal ennustavad tõsisemad futuroloogid lausa mitmete seniste majandusharude kollapsit ning uute senitundmatute ärisuundade ja töökohtade teket.
Kooliõpilased üle maailma on jaganud näiteid, kuidas copy-paste klikiga ChatGPT-ist valmivad nende kodutööd. Sisekujundajad on lasknud uudsel robotil modelleerida kaasaegsete inimeste kõige ihaldusväärsemaid kodusid. Sopranode müstiliselt lõppev viimane osa on saanud sõnades kõige tõenäolisema tegeliku lõpu. Ja nii edasi.
Kuid kõigi nende peadpööritavate arengute juures on tahaplaanile jäänud see, mida ChatGPT endast tegelikult kujutab, kuidas see töötab ja milliste riskidega tuleb selle kasutamisel arvestada.
ChatGPT on intelligentne tööriist, mis on treenitud suurtel andmemassiividel, millest see kui reha läbi käib, ning mis seejärel suudab genereerida päringule vastamiseks vajaliku inimesele kergesti arusaadavasse teksti. Sellest aspektist tuleb ChatGPT loodavasse sisusse suhtuda täpselt samasuguse kriitikaga nagu traditsioonilise andmekaeve või ka otsingurakenduse tulemustesse.
Võiks eeldada, et selliste töövahendite genereeritud vastused põhinevad alati või vähemalt reeglina üldisel avalikul infol, mille kasutamise suhtes pole kellelgi eriõigusi või pretensioone. Kuid juba pisut põhjalikum pilguheit telgitagustesse annab meile olukorrast sootuks teise pildi.
ChatGPT kasutustingimuste kohaselt kuulub kogu ChatGPT poolt kasutaja jaoks loodud väljund kasutajale. Euroopas (sh Eestis) ja ka maailmas üldtunnustatud autoriõiguse põhimõtete kohaselt kuulub sellise tingimuse alusel ChatGPT genereeritud väljundi autoriõigus kasutajale.
Kuid kui ChatGPT väljund juba ise rikub kellegi õigusi?
Asjaolu, et veebiavarustes paiknev sisu on ChatGPT jaoks intelligentseks töötluseks saadaval, ei tähenda, et see pole autoriõiguse või muude õigustega kaitstud. Selliste süsteemide puhul nagu ChatGPT eksisteerib arvestatav risk, et loodud sisu rikub sellise materjali õiguste omaniku autoriõigusi või andmebaasiõigusi. ChatGPT on õpetatud ulatuslike teksti- ja muude andmekogude põhjal ning selliste materjalide täpne allikas on ebaselge. Selle tulemusena võib ChatGPT loodud väljund olla sarnane või isegi identne juba olemasolevate teostega, mis tekitab reaalse ohu, et väljundi loata kasutamine võib kujutada endast autoriõiguste rikkumist.
Näiteks võivad ChatGPT päringuvastused sisaldada terveid lõike kellegi kirjutatud raamatust või andmebaasist, mis võib olla avalikult kättesaadav, kuid alluda kolmandate isikute jaoks avaldaja määratud eritingimustele (litsents), või veel hullem, rippuda internetis üleval õigusvastaselt autori teadmiseta ja loata. Kui mõni ablas tudeng kasutab sellist materjali ChatGPT loodud väljundina, lootuses, et sisu on kasutaja enda oma, on juriidilises mõttes tulemuseks plagiaat.
ChatGPT üksnes süvendab erinevate tehisintellektide levikuga kaasa tulnud modernseid probleeme kunsti- ja loomevaldkondades, kus loojate nõusolekuta kasutatakse kirjandus- ja kunstiteoseid. Hiljuti kaebas Getty Images kohtusse tehisintellekti pakkuja Stability AI, kuna robot väidetavalt kopeeris ilma autoriõiguste omajate loata miljoneid eksemplare fotodest ja muust autoriõigusega kaitstud sisust.
Kaitset ei anna sellisel juhul ka ChatGPT kasutustingimused, mis vastukaaluks eelnevalt viidatud väljundi õigustele näevad lisaks ette, et OpenAI ei vastuta ChatGPT kasutamisest tulenevate kahjude eest ja et see antakse “sellisena nagu on” ilma väljundi täpsuse ja konkreetsel eesmärgil kasutatavuse garantiita. Lisaks on OpenAI vastutuse ülempiir 100 dollarit või teenuse eest viimase 12 kuu jooksul makstud summa, olenevalt sellest, kumb on suurem.
Sisuliselt antakse sellise juriidilise lahendusega kasutajale kiirusepiiranguteta tee ja sportauto. Mida kasutaja edasi pihta hakkab, on tema enda valik ja riisiko.
Samalaadsed riskid esinevad ChatGPT kasutamisel ka seoses isikuandmetega. ChatGPT on treenitud suure andmemahu põhjal, mis hõlmab vältimatult erinevaid isikuandmeid alates isikunimedest ja lõpetades erineva delikaatse infoga. Kuigi väidetavalt on ChatGPT treenitud kasutama vaid avaliku elu tegelaste ja oma andmed avalikustanud isikute isikuandmeid, ei ole vähemalt täna piisava kindlusega välistatud oht, et isikuandmeid võidakse töödelda õigusvastaselt. Täpselt nii, nagu tuleks olla ettevaatlik nn googeldamise käigus isikuandmete saamisel ja edasisel kasutamisel, tuleks seda ka ChatGPT vastuste puhul. Oluline on arvestada, et OpenAI ChatGPT kasutustingimused panevad kasutajale kohustuse tagada, et tal on õigus töödelda mistahes isikuandmeid.
Lisaks tasuks meeles pidada, et ChatGPT andmed on täpsuse ja adekvaatsuse kontekstis korrelatsioonis selle treenimisandmetega. Kui need sisaldavad vigu või ebatäpsusi, siis kajastuvad need vastustes. ChatGPT kasutajatel ei ole kontrolli selle treenimiseks kasutatavate andmekogumite ega selle töötavate algoritmide üle. Kasutajad sõltuvad täielikult sellest, kuidas OpenAI AI ChatGPT välja treenis. Kuidas see täpsemalt toimus, jääb laiemale avalikkusele saladuseks.
Näiteks tuleks tähelepanelik olla olemasolevate negatiivsete stereotüüpide põlistamise vältimisel. Rassilised, soolised, vanuselised ja muudel alustel diskrimineerimised võivad olla kerged tekkima eriti juhul, kui ChatGPT peaks ühel või teisel juhul kasutama vastuste genereerimisel peaasjalikult ajaloolist kogemust või statistikat. Praktikas on täheldatud ka erinevate viraalseks muutunud vihakõnede sattumist ChatGPT valikusse, mis samuti vastuseid mõjutab. Selliste väljundiks muundatud tekstide valimatu edasikasutamine kasutaja poolt võib sõltuvalt asjaoludest lõppeda soovimatute tagajärgedega.
Samuti tasub meeles pidada, et ChatGPT treenimisandmed kujutavad endast hetketõmmist internetist teatud ajahetkel. Hetkel on ajatempliks 2021. Peale seda on genereeritav info võrdlemisi limiteeritud.
Kõik need küsimused ja näited illustreerivad, kuidas isegi revolutsiooniline innovatsioon vajab aega, et areneda ja täieneda. ChatGPT piiritud võimalused ja kasutegurid erinevates valdkondades juba täna ei võimalda lõpetada siinkohal tuntud Eesti rahva vanasõnaga esimesest vasikast. Kuid teadvustada tuleks kõiki karisid ja vältida ChatGPT kriitikavaba kasutamist mistahes eesmärkidel. Hetkel tuleks näha selle väärtust eeskätt uudse ja lihtsal viisil infot pakkuva abimehena, mitte sisu loojana. Robotite poolt maailma ülevõtmine peab laskma end veel vähemalt mõnda aega oodata.
Tambet Toomela
Partner
+372 622 9990