Kui küsida, mis on inimkonna tervisele kõige rohkem mõju avaldanud, ei ole vastus ükski konkreetne ravim ega operatsioon. Kõige suuremad hüpped on toonud vaktsineerimine ja üldhügieen — puhas joogivesi, reovee ärajuhtimine, kätepesu [1][2]. Üks klassikaline näide vee rollist nakkuste levikus on 1854. aasta Londoni koolerapuhangu uurimine, kus John Snow seostas haigestumised Broad Streeti pumba veega ning pumba käepideme eemaldamise järel puhang vaibus. [3 Samuti oli 19. sajandi keskpaigani sünnitamine paljudes Euroopa haiglates eluohtlik: arstid tegid lahanguid ja läksid seejärel otse sünnitust vastu võtma, pesemata käsi. Ignaz Semmelweis näitas Viinis, et kloorilahusega kätepesu vähendab sünnituspalavikku järsult [4]
Oluline on märgata mustrit: kõik need suured edusammud on tulnud väikeste, järk-järguliste sammude kaupa. Mitte ükski neist ei olnud üleöö revolutsioon. Küsimus, mida me täna peame küsima, on see: kas tehisintellekt suudab pakkuda järgmisi väikseid samme võitoob ise esile suure hüppe? Ja kui suudab — siis millises suunas?
Mõistmaks, kuidas võib AI tuua esile suure hüppe, on seda hea võrrelda energiaga. Ajalooliselt on energia ligipääs olnud väike ja siis järk-järgult paranenud: alguses veoloomad, tuule-ja vesiveskid ning aurumasinad suurendasid ligipääsu, aga elekter tegi energia universaalseks teenuseks, mida saab pistikust kohe võtta ehk kättesaadavaks. Raamatud, koolid ja internet andsid teadmisele ligipääsu, aga nüüd tehisaru, sealhulgas keelemudelid, muudavad (meditsiini)teadmised kiireks suuliseks küsimiseks ja seetõttu ka massiliselt tarbitavaks.
Esimene kiusatus on mõelda, et suured keelemudelid — ChatGPT, Claude, Gemini ja teised — suudavad leevendada ülemaailmset meditsiinitöötajate puudust. Idee on ahvatlev: kui igal inimesel on taskus arst, kes ei väsi kunagi vastamast ja uurimast, siis ehk ei olegi vaja nii palju arste? Paraku näitab teaduskirjandus, et sellest ollakse veel kaugel. Veelgi enam, siin kehtib Jevonsi paradoks: mida lihtsamaks ja odavamaks tervisepäringute esitamine muutub, seda rohkem neid esitatakse. [5] OpenAI andmetel kasutab ChatGPT-d juba sadu miljoneid inimesi iganädalaselt ja märkimisväärne osa neist vestlustest puudutab tervist [6]. Võib juhtuda, et ligipääsu suurendamine ei vähenda survet tervishoiusüsteemidele, vaid hoopis suurendab nõudlust.
Teiseks, hetkel on tehisaru piiratud võime diagnoosida: 2025 aasta kevadel avaldatud Nature'i töös tõdeti, et keelemudelite diagnostilistes soovitustes tekib süstemaatiline nihe kohe, kui patsiendi kirjelduses mainitakse sotsiaal-majanduslikke tegureid või LGBTQ-identiteeti. See tähendab, et mudel ei kohalda sama haiguse puhul samu diagnostilisi kriteeriume kõigile inimestele — see on põhimõtteline probleem, mida ei saa lahendada lihtsalt suurema treeningandmestikuga. [7] Viimasel ajal on välja tuldud spetsiaalselt meditsiinile häälestatud ChatGPT Health, mille uurimisel leiti ikkagi puudujääke: näiteks ignoreerib see otseseid enesetapumõtteid, jättes need märkamata, või jääb liigselt kinni patsiendi lähedase öeldusse ega suuna eluohtlikes seisundites patsienti erakorralisse meditsiini. [8]
Enese diagnoosimise lõks. Sellest hoolimata on AI-ga ise diagnoosimine juba massiline reaalsus — seda ei saa ega ole mõtet eitada. Probleem on selles, et see toimub piisavalt sageli, et luua illusiooni usaldusväärsusest. Edukad juhtumid, kus inimene „leidis" oma kroonilistele sümptomitele konkreetse diagnoosi ChatGPT abil, levivad sotsiaalmeedias ja uudistes, kuid ebaõnnestumised — valediagnoosid, hilinenud ravi, ohtlikud nõuanded — jäävad varju. See on klassikaline ellujäämiskallutatus (survivorship bias): me näeme neid, kes said abi, aga mitte neid, kes said kahju. Mastaabi juures, kus kümned miljonid inimesed küsivad ChatGPT-lt iga päev tervisenõu, on isegi väike veaprotsent absoluutarvudes hirmutav.
Andmete kvaliteet lisab keerukust. Üha rohkem inimesi kannab erinevaid seadmeid nt nutikellad, pulsikellad, unerõngad, mis mõõdavad tervisega seotud parameetreid unekestvus pulsisagedus “stressimõõdik”. Meeles peab hoidma, et sama seade võib anda eri randmeasendites erinevaid tulemusi, pidev kandmine võib ununeda, sensorid vajavad kalibreerimist jne. Kui keelemudelid hakkavad nende andmete põhjal soovitusi andma, siis ehitame otsuseid ebakindlale vundamendile.
Eelöeldust hoolimata ei tähenda see, et tehisintellektil pole meditsiinis kohta. Vastupidi — see sobitub ideaalselt olemasolevate meditsiinitöötajate toetamiseks, selle asemel et neid asendada.
Kõige otsesem ja juba kasutusel olev tehisaru rakendamine meditsiinis on patsiendi-arsti vestluse transkribeerimine vastuvõtu ajal. Arst ei pea enam ise kõike üles kirjutama — keelemudelid kuulavad vestlust, teevad kokkuvõtte ja valmistavad ette dokumentatsiooni, mille lõplikult arst või muu meditsiinitöötaja üle vaatab. See ei ole pelgalt mugavus: parem dokumenteerimine tähendab paremat andmekvaliteeti ja parem andmekvaliteet tähendab omakorda täpsemaid teadust (ja ennustusmudeleid) tulevikus.
Mida aeg edasi seda spetsialiseeritumaks on meditsiin läinud. Seetõttu on ühel hetkel muutunud spetsialistide vaheline suhtlus keerulisemaks. Selle olukorra kergendamiseks saab ka keelemudelid appi tulla ja 2025 aastal avaldatud teadustöös leiti, et silmaarstide sissekandeid saab muuta arusaadavamaks koos tehisaru abiga [9]
Kui diagnoosimise juures keelemudelid lahendust ei paku, siis õnneks saab treenida mudeleid konkreetsemates domeenides ja seal tulemused on juba kaalukamad. Delphi-2M treeniti UK Biobanki ~400 000 osaleja terviseandmetel ja testiti eraldi 1,9 miljoni Taani patsiendi andmete peal. See suudab prognoosida riske enam kui 1000 haiguse jaoks. [10][11] Samalaadselt on välja töötatud unemudel nimega SleepFM, mis suudab üheainsa öö uuringu salvestuse abil prognoosida kasvajatest, raseduse tüsistustest kuni vaimse tervise probleemideni välja [12]
Märkimisväärselt tugevad tulemused on tulnud ka vere ringlevate valkude kohta. Hiljuti Nature Medicine'is avaldatud ProtAIDe-Dx mudel kasutab plasmavalke, et anda samaaegne hinnang kuuele dementsusega seotud seisundile . Oluline on, et mudel tuvastas riskirühmi ka nende inimeste seas, kellel kognitiivseid häireid veel polnud. See on juba ennetuse, mitte ravi mudel. [13]
Lõpetuseks peab tõdema, et tehisaru vaba meditsiini Eestis enam lihtsalt ei saa. Insuldi puhul hinnatakse masinõppe abil, kui suur on haaratud ajukude ja kui palju on veel päästetavat raviprotseduuriga. Vähi kiiritusravis on kiiritatava piirkonna ja kiirituse suhtes tundliku koe kaardistamine mudelite abil kordades kiirem kui käsitsi tehtuna. Need ei ole tulevikuvisioonid need on tänane igapäev juba enne keelemudelite tulekut. [14]
Tehnoloogia toob ohte - tavainimesed on läinud tehisaru jutuga kaasa, arvates end matemaatilisteks geeniusteks, kes on lahendanud keerulisi võrrandeid, tegelikult olid need mudelite meelitused, sest keelemudelid kalduvad kasutajale meeldima, mitte teda korrigeerima. [15]
See meelitusprobleem on tegelikult sügavam, kui esmapilgul tundub. Veel retsenseerimata teadustöös näidati matemaatiliselt, et isegi ideaalselt ratsionaalne kasutaja pettekujutluste spiraalile, kus vestlusrobot kinnitab kasutaja ekslikke uskumusi samm-sammult, kuni need muutuvad püsivaks veendumuseks. Kõige hirmutavam järeldus: see efekt püsib ka siis, kui mudelil keelatakse hallutsineerida valefakte, ja ka siis, kui kasutajat teavitatakse, et mudel võib olla meelitav. Kumbki kaitsemeede ei tööta piisavalt. [16]
AI-sõltuvus on samuti reaalne probleem, millele on juba loodud hindamisskaala. [17] Kui ChatGPT-4o **mudeli toetamine peatati väljendasid paljud kasutaja pahameelt, kuna ta oli oma suhtluskeelelt emotsionaalsem võrreldes varasemate mudeliteaga ja oli nii mõnegi kasutaja jaoks muutunud "sõbraks". [18]
Kõige tõsisemad on aga juhtumid, kus inimesed on otsinud terviseabi, kuid saanud hoopis kahjuliku soovituse — näiteks mees, kes küsis tehisarult tervislikumat alternatiivi soolale ja sai vastuseks aine, mis kroonilisel tarvitamisel osutus surmavaks. [19]
Desinformatsiooni levitamise oht. Eraldi ja väga tõsisena tuleb käsitleda AI veenvust. Hiljutine töö näitas, et vestlusliku AI veenvust saab mudeli loomise järgse peenhäälestuse ja viipamise (prompting) abil tõsta koguni 51% ja 27% võrra. Toodi samas välja, et veenvuse tõustes muutus langes faktiline täpsus. [20]. Meditsiini kontekstis saab arutleda, et alternatiivmeditsiini, pseudoteaduse levitajad ja šarlatanid saavad tehisaru abil oma sõnumi massiliselt levitada viisil, mis on varasemast kordades veenvam, kordades personaliseeritum ja kordades raskem eristada tõenduspõhisest meditsiinist.
Need praktilised ohud viivad meid sügavamate küsimuste juurde. Kui palju me üldse saame ja tahame tehisaru meditsiinis usaldada? Vastuolu on silmatorkav: me tahame, et radioloog jääks oma arvamusele ja kontrolliks iga tulemuse üle, isegi kui tehisintellekt teda toetab. Samas isesõitvate autode puhul tundub piisavat meile, kui need teevad vähem õnnetusi kui inimesed, sest inimesed teevad niikuinii vigu.
Veelgi keerulisem on küsimus ravimite kohta, mille loomisel pole ükski inimene otseselt sisendit andnud. Kujutage ette: tehisaru labor saab patsiendilt võetud vähirakud, analüüsib neis olevaid molekule, sekveneerib genoomi, loob arvutis simuleeritud ravimikandidaadid, katsetab neid (vähi)rakukultuuris ja/või laboris kasvatatud mini-organis ning tõendab efektiivsust. Kas me aktsepteerime sellist ravimit? Kas patsiendid tahavad seda? Kas on oluline, et inimene on selle konkreetse ravimi disaininud — või on pigem oluline, et patsient saab ravitud ja/või kogu süsteem on loodud inimese poolt? Need küsimused ei ole hüpoteetilised, sest esimesed väiksemad sarnased töövood on juba olemas. [21].
Meeles peab pidama, et masinõpe õpib mustrid andmetes ehk teisisõnu kristalliseerub need otsustusreeglid, mis on inimeste arusaama hetkel. Aga meil on veel pikk tee minna, enne kui me täpselt mõistame kõiki haigusprotsesse. Diagnoosikriteeriumid muutuvad pidevalt nt ärritunud soolesündroomil on juba IV Rooma kriteeriumid väljas [22]. Ja ajalugu peaks tuletama meile meelde tagasihoidlikkust, sest me ravisime kunagi naistel hüsteeriat [23]
Kui probleemid ja ohud on selged, siis millised lahendused on silmapiiril? Üks kõige olulisematest on Euroopa terviseandmeruumi seadus (European Health Data Space Act), mis peaks parandama nii esmaste kui ka teiseste terviseandmete liikumist riikide vahel. Praktikas tähendab see, et kui inimene läheb Portugali, saavad sealsed arstid teada, näiteks kas tal on mingi ravimi vastu allergia. Ja teisalt saavad teadlased kasu Portugali inimeste geneetika- ja biopangaandmetest kasu, sest Euroopa riikide info tehakse kõigile teadlastele teiseseks kasutamiseks kättesaadavamaks. [24]
Teaduse tegemisele aitaks kaasa agentne koodikirjutamine — tehisarule põhinevad tööriistad nagu Codex ja Claude Code, mis vähendavad teaduslaborite IT-võlga [25]. Kiirem kood tähendab kiiremat teadust ja kiirem teadus on peaaegu alati hea asi. Teadusandmebaasidel põhinevad tehisaru nt Scopus AI ja Elicit, Consensus aitavad samuti ideest rakenduseni jõuda, vähendades seda kuristikku, mis traditsiooniliselt lahutab avastust kliinilisest praktikast
Laiemas plaanis suudaksime tehisaru abil vältida kahjustavat ja väheväärtuslikku meditsiini neid protseduure ja uuringuid, mis patsiendile tegelikult kasu ei too, aga koormavad tervishoiusüsteemi. Sellel on ka keskkonnamõõde. Hea rusikareegel on: “high value health care is low carbon health care” — kui tervishoid teeb rohkem seda, mis päriselt aitab, on see sageli ühtlasi väiksema jalajäljega.[26] Paremad otsustussüsteemid aitaksid vähendada madala väärtusega tegevust (ja seega ka raisatud ressursse), aga valesti kasutades võivad nad Jevonsi-loogika tõttu hoopis nõudlust ja sekkumisi kasvatada.
Lootust annab, et tehisintellekti areng aitab edaspidi lahendada toidu tootmise, transpordi ja raiskamisega seotud probleeme, näiteks täppisviljeluse ja nutikama logistika kaudu, kus satelliidipildid ja masinõpe aitavad varakult tuvastada stressi, haigusi või toitainete puudust põllutööde marsruute ning tugevdada põllumajanduse tarneahelaid, vähendades kütusekulu, ajakadu ja saagikaotusi logistikas. [27][28][29][30][31]
Kokkuvõttes ei ole küsimus selles, kas tehisintellekt muudab meditsiini — see juba teeb seda. Küsimus on selles, kas me suuname selle muutuse teadlikult parema andmekvaliteedi ja inimese-masina koostöö suunas — või laseme sel juhtuda juhuslikult, koos kõigi riskidega, mida veenvam tehisaru ja skaleeritav desinformatsioon kaasa toovad.