Du kan bli tilgitt for å tro at AI snart vil erstatte menneskelige leger basert på overskrifter som "AI-doktoren vil se deg nå, " "Din fremtidige lege kan ikke være menneskelig, " og "Denne AI bare slå menneskelige leger på en klinisk eksamen . ”Men eksperter sier at virkeligheten er mer et samarbeid enn å utgi: Pasienter kunne snart finne livet delvis i hendene på AI-tjenester som jobber sammen med humane klinikere.
Det er ingen mangel på optimisme rundt AI i det medisinske samfunnet. Men mange advarer også om at hypen rundt AI ennå ikke er blitt realisert i reelle kliniske omgivelser. Det er også forskjellige visjoner for hvordan AI-tjenester kan ha størst betydning. Og det er fremdeles uklart om AI vil forbedre livene til pasienter eller bare bunnlinjen for Silicon Valley-selskaper, helseorganisasjoner og forsikringsselskaper.
"Jeg tror at alle våre pasienter faktisk burde ønske at AI-teknologier skal bære svakheter i helsevesenet, men vi må gjøre det på en ikke-Silicon Valley hype-måte, " sier Isaac Kohane, en biomedisinsk informatikkforsker ved Harvard Medical School.
Hvis AI fungerer som lovet, kan det demokratisere helsehjelpen ved å øke tilgangen for undervurderte samfunn og senke kostnadene - en velsignelse i USA, som rangerer dårlig på mange helsetiltak til tross for en gjennomsnittlig årlig helseomsorgskostnad på $ 10 739 per person. AI-systemer kan frigjøre overarbeidede leger og redusere risikoen for medisinske feil som kan drepe titusenvis, om ikke hundretusener, amerikanske pasienter hvert år. Og i mange land med nasjonal legemangel, som Kina hvor overfylte urbane sykehus 'polikliniske avdelinger kan se opptil 10.000 mennesker per dag, trenger ikke slike teknologier perfekt nøyaktighet for å vise seg å være nyttig.
Men kritikere påpeker at alt dette løftet kan forsvinne hvis hastverket med å implementere AI tramper pasientens personvernrettigheter, overser skjevheter og begrensninger, eller ikke klarer å distribuere tjenester på en måte som forbedrer helseutfallet for folk flest.
"På samme måte som teknologier kan lukke ulikheter, kan de forverre ulikhetene, " sier Jayanth Komarneni, grunnlegger og leder av Human Diagnosis Project (Human Dx), et selskap med allmennyttighet som fokuserer på medisinsk ekspertise i massevirksomhet. "Og ingenting har den evnen til å forverre forskjeller som AI"
***
I dag er de mest populære AI-teknikkene maskinlæring og dens yngre fetter, dyp læring. I motsetning til dataprogrammer som stivt følger regler skrevet av mennesker, kan både maskinlæring og dyp læringsalgoritmer se på et datasett, lære av det og komme med nye spådommer. Spesielt dyp læring kan gi imponerende spådommer ved å oppdage datamønster som folk kan savne.
Men for å få mest mulig ut av disse spådommene i helsevesenet, kan AI ikke gå alene. Snarere må mennesker fremdeles være med på å ta beslutninger som kan ha store helsemessige og økonomiske konsekvenser. Fordi AI-systemer mangler den generelle intelligensen til mennesker, kan de komme med forvirrende spådommer som kan vise seg å være skadelige hvis leger og sykehus utvilsomt følger dem.
Det klassiske eksemplet kommer fra Rich Caruana, en seniorforsker ved Microsoft Research, som han forklarte i Engineering and Technology magazine i fjor. På 1990-tallet jobbet Caruana på et prosjekt som prøvde å bruke en tidligere form for maskinlæring for å forutsi om en pasient med lungebetennelse var en lavrisiko- eller høyrisikosak. Men det oppsto problemer da maskinlæringsmodellen prøvde å forutsi tilfellet for astmapasienter, som er høyrisiko fordi deres eksisterende pustevansker gjør dem sårbare for lungebetennelse. Modellen festet disse pasientene som lavrisiko og krevde mindre inngrep i stedet for sykehusinnleggelse - noe en menneskelig ekspert aldri ville ha gjort.
Hvis du følger modellen blindt, sier Kenneth Jung, forskningsforsker ved Stanford Center for Biomedical Informatics Research, "så er du sløret. Fordi modellen sier: 'Åh, denne gutten med astma kom inn og de fikk lungebetennelse, men vi trenger ikke bekymre oss for dem, og vi sender dem hjem med litt antibiotika.' ”
Dypelæringsspådommer kan også mislykkes hvis de møter uvanlige datapunkter, for eksempel unike medisinske tilfeller, for første gang, eller når de lærer særegne mønstre i spesifikke datasett som ikke generaliserer godt til nye medisinske tilfeller.
AI-spådommene klarer seg best når de brukes på massive datasett, for eksempel i Kina, som har en fordel når det gjelder å trene AI-systemer takket være tilgang til store populasjoner og pasientdata. I februar publiserte tidsskriftet Nature Medicine en studie fra forskere med base i San Diego og Guangzhou, Kina, som viste løfte om å diagnostisere mange vanlige barnesykdommer basert på de elektroniske helsejournene til mer enn 567 000 barn.
Men selv store datasett kan gi problemer, spesielt når forskere prøver å bruke algoritmen til en ny populasjon. I Nature Medicine- studien kom alle de halv million millionene av pasientene fra ett medisinsk senter i Guangzhou, noe som betyr at det ikke er noen garanti for at diagnostiske leksjoner fra trening på dette datasettet vil gjelde for barn i andre tilfeller. Hvert medisinsk senter kan tiltrekke seg sitt eget unike sett med pasienter - et sykehus som er kjent for sitt hjerte- og karsenter, for eksempel, kan tiltrekke seg mer kritiske hjertesykdommer. Og funn fra et Guangzhou-sykehus som for det meste tiltrekker etniske kinesiske pasienter, kan ikke oversette til en i Shanghai med et større antall utenlandsfødte, ikke-kinesiske pasienter.
I denne TEDx Talk 2017 forklarer Shinjini Kundu fra Johns Hopkins Hospital hvordan AI-verktøy har potensial til å skaffe seg mer fra medisinske bilder enn leger alene kan - inkludert å forutsi sykdommer før pasienter viser symptomer.
Denne ekstrapolasjonen vil også være vanskelig i andre situasjoner. For eksempel, sier Marzyeh Ghassemi, en datamaskinforsker og biomedisinsk ingeniør ved University of Toronto, og sier at du har 40 000 ICU-pasienter ved Beth Israel Deaconess Medical Center - det er bare ett sykehus i en by. “Og så har jeg alle disse papirene som har spådd med disse dataene. Fungerer det med et annet sykehus i Boston? Kan være. Fungerer det for et sykehus i en annen stat? Ville det fungere i et annet land? Vi vet ikke. "
***
Mens AI-modeller kanskje ikke fungerer i alle tilfeller, mener Ghassemi at teknologien fortsatt er verdt å utforske. "Jeg er veldig tilhenger av å ta disse modellene fra benken til sengekanten, " sier hun, "men med virkelig aggressive forsiktighetsregler."
Disse trinnene må eksistere gjennom AI-utvikling og distribusjon, sier I. Glenn Cohen, jusprofessor ved Harvard University og leder for prosjektet om presisjonsmedisin, kunstig intelligens og loven. Dette kan innebære å verifisere nøyaktigheten og åpenheten i AI-prediksjoner. Og under datainnsamling vil forskere også måtte beskytte pasientens personvern og be om samtykke til å bruke pasientdata for å trene AI
Samtykkespørsmålet kommer opp igjen når AI-modellen er klar for eksperimentell klinisk testing med virkelige pasienter. "Må pasienter bli fortalt at du bruker algoritmen på dem, og har det noe å si om AI er fullstendig veiledende eller delvis guider omsorg?" Spør Cohen. "Det er veldig lite tanker om disse spørsmålene."
Ghassemi tar også til orde for hyppig revisjon av AI-algoritmer for å sikre rettferdighet og nøyaktighet på tvers av forskjellige grupper mennesker basert på etnisitet, kjønn, alder og helseforsikring. Det er viktig gitt hvordan AI-applikasjoner i andre felt allerede har vist at de lett kan plukke opp skjevheter.
Etter alle trinnene, vil menneskene og selskapene som leverer AI-tjenester måtte sortere juridisk ansvar i tilfelle uunngåelige feil. Og i motsetning til de fleste medisinske apparater, som vanligvis bare trenger en godkjenning, kan AI-tjenester kreve ytterligere gjennomgang når de lærer av nye data.
Noen reguleringsbyråer vurderer på nytt hvordan de skal vurdere helsevesenet AI. I april ga US Food and Drug Administration (FDA) ut et diskusjonsdokument for å få offentlige tilbakemeldinger om hvordan de kan oppdatere relevant forskriftsanmeldelse. "Det vi kontinuerlig prøver å gjøre her, er å komme tilbake til vårt mål om å gi folk tilgang til teknologier, men vi er også klar over at de nåværende metodene våre ikke fungerer så bra, " sier Bakul Patel, direktør for digital helse ved FDA. "Derfor må vi se på en helhetlig tilnærming til hele produktets livssyklus."
I tillegg til spørsmål rundt tilgang, personvern og forskrifter, er det heller ikke klart hvem som vil dra mest nytte av helsetjenester i AI. Det er allerede ulikheter i helsevesenet: I følge Verdensbanken og Verdens helseorganisasjon mangler halvparten av jordens befolkning tilgang til viktige helsetjenester, og nesten 100 millioner mennesker blir presset til ekstrem fattigdom av utgifter til helsehjelp. Avhengig av hvordan det er distribuert, kan AI enten forbedre disse ulikhetene, eller gjøre dem verre.
"Mye av AI-diskusjonen har handlet om hvordan man demokratiserer helsehjelpen, og jeg vil se at det skjer, " sier Effy Vayena, en bioetiker ved Federal Institute of Technology i Sveits.
"Hvis du bare ender med en mer avansert tjenesteyting til de som uansett hadde råd til god helsehjelp, " legger hun til, "jeg er ikke sikker på om det er den transformasjonen vi ser etter."
Hvordan alt dette spiller ut avhenger av de forskjellige visjonene for implementering av AI. Tidlig utvikling har fokusert på svært smale diagnostiske applikasjoner, for eksempel å granske bilder for antydninger til hudkreft eller neglesopp, eller lese røntgenbilder av brystet. Men nyere innsats har forsøkt å diagnostisere flere helsetilstander samtidig.
I august 2018, Moorfields Eye Hospital i Storbritannia og DeepMind. det London-baserte AI-laboratoriet som eies av Googles morselskap Alphabet, viste at de med hell hadde trent et AI-system for å identifisere mer enn 50 øyesykdommer i skanninger, noe som stemte overens med ytelsen til ledende eksperter. Tilsvarende brede ambisjoner drev San Diego og Guangzhou-studien som trente AI til å diagnostisere vanlige plager blant barn. Sistnevnte var ikke like flink til å diagnostisere pediatriske sykdommer sammenlignet med eldre leger, men den presterte bedre enn noen juniorleger.
Slike AI-systemer trenger kanskje ikke å utkonkurrere de beste menneskelige eksperter for å hjelpe til med å demokratisere helsehjelpen, men bare utvide tilgangen til gjeldende medisinske standarder. Foreløpig, så langt, er mange foreslåtte AI-applikasjoner fokusert på å forbedre den nåværende standarden på pleie i stedet for å spre rimelig helsehjelp rundt, sier Cohen: "Å demokratisere det vi allerede har, ville være en mye større smell for pengene dine enn å forbedre det vi har i mange områder. ”
Accenture, et konsulentfirma, spår at topp AI-applikasjoner kan spare den amerikanske økonomien $ 150 milliarder dollar per år innen 2026. Men det er uklart om pasienter og helsevesenet systemer supplert med skattebetalernes dollar vil ha fordel, eller om mer penger rett og slett vil strømme til teknologiselskapene, helsepersonell og forsikringsselskaper.
"Spørsmålet om hvem som skal drive dette og hvem som skal betale for dette er et viktig spørsmål, " sier Kohane. "Noe som er litt hallusinatorisk med alle de forretningsplanene, er at de tror de vet hvordan det vil ordne seg."
Selv om AI-tjenester gir kostnadsbesparende anbefalinger, kan menneskelige leger og helseorganisasjoner nøle med å ta AI-råd hvis de tjener mindre penger som et resultat, advarer Kohane. Det taler til det større systemiske problemet med amerikanske helseforsikringsselskaper ved å bruke en avgift-for-service-modell som ofte belønner leger og sykehus for å legge til tester og medisinske prosedyrer, selv når det ikke er behov for det.
***
Det er en annen AI-mulighet som kan forbedre kvaliteten på omsorgen, mens du fortsatt lar de fleste medisinske diagnoser i legenes hender. I sin bok fra 2019, Deep Medicine, snakker Eric Topol, direktør og grunnlegger av Scripps Research Translational Institute, om å lage en superladet medisinsk Siri - en AI-assistent for å ta notater om interaksjonen mellom leger og deres pasienter, legge inn disse merknadene innen elektronisk helse poster, og minne leger om å spørre om relevante deler av pasientens historie.
"Min ambisjon er at vi dekomprimerer legenes arbeid og blir kvitt deres dataforhandlerrolle, hjelper pasienter med å ta mer ansvar og nøkkel opp dataene, så det ikke tar så lang tid å gå gjennom ting, " sier Topol.
Den "glemte medisinske assistenten eller skribenten, " sier Kohane, ville kreve AI som automatisk kan spore og transkribere flere stemmer mellom leger og pasienter. Han støtter Topols ide, men legger til at de fleste AI-applikasjoner i utvikling ikke ser ut til å være fokusert på slike assistenter. Fortsatt har noen selskaper som Saykara og DeepScribe utviklet tjenester i tråd med disse linjene, og til og med Google gikk sammen med Stanford University for å teste en lignende “digital scribe” -teknologi.
En AI-assistent kan høres mindre spennende ut enn en AI-lege, men det kan frigjøre leger til å tilbringe mer tid med pasientene sine og forbedre den generelle kvaliteten på omsorgen. Spesielt familieleger bruker ofte mer enn halvparten av arbeidsdagene sine på å legge inn data i elektroniske helsejournaler - en hovedfaktor bak fysisk og emosjonell utbrenthet, som har alvorlige konsekvenser, inkludert pasientdødsfall.
Ironisk nok skulle elektroniske helsejournaler forbedre medisinsk behandling og kutte kostnader ved å gjøre pasientinformasjon mer tilgjengelig. Nå pekte Topol og mange andre eksperter på elektroniske helsejournaler som en advarsel for den aktuelle hypen rundt AI innen medisin og helsehjelp.
Implementeringen av elektroniske helsejournaler har allerede skapt et lappeteppssystem spredt blant hundrevis av private leverandører som hovedsakelig lykkes med å isolere pasientdata og gjøre det utilgjengelig for både leger og pasienter. Hvis historien er noen guide, vil mange teknologiselskaper og helsevesenet organisasjoner føle drag for å følge lignende veier ved å oppbevare medisinsk data for sine egne AI-systemer.
En vei rundt dette kan være å bruke et kollektivt etterretningssystem som aggregerer og rangerer medisinsk ekspertise fra forskjellige kilder, sier Komarneni, som prøver denne tilnærmingen med Human Dx. Støttet av store medisinske organisasjoner som American Medical Association, har Human Dx bygget en online plattform for rådgivning fra tusenvis av leger om spesifikke medisinske tilfeller. Komarneni håper at en slik plattform i teorien også en dag kan inneholde diagnostiske råd fra mange forskjellige AI-tjenester.
"På samme måte som flere menneskelige fagfolk kan se på saken din i fremtiden, er det ingen grunn til at flere AI ikke kunne gjøre det, " sier Komarneni.
Mens legene venter på deres AI-hjelpere, kan crowddsourcing-prosjekter som Human Dx "definitivt føre til forbedret diagnostikk eller til og med forbedrede anbefalinger for terapi, " sier Topol, som medforfatter til en studie i 2018 på en lignende plattform kalt Medscape Consult. Oppgaven konkluderte med at kollektiv menneskelig intelligens kunne være en "konkurrerende eller komplementær strategi" til AI i medisin.
Men hvis AI-tjenester består alle testene og den virkelige sjekken, kan de bli viktige partnere for mennesker i omformingen av moderne helsehjelp.
"Det er ting som maskiner aldri vil gjøre bra, og deretter andre der de vil overskride hva ethvert menneske kan gjøre, " sier Topol. "Så når du setter sammen de to er det en veldig kraftig pakke."
***
Jeremy Hsu er frilansjournalist med base i New York City. Han skriver ofte om vitenskap og teknologi for blant annet Backchannel, IEEE Spectrum, Popular Science og Scientific American.
Denne artikkelen ble opprinnelig publisert på Undark. Les den opprinnelige artikkelen.