Å diagnostisere depresjon er en vanskelig virksomhet.
Det er ingen blodprøve, ingen skanning, ingen biopsi som gir bevis på at noe har gått galt. I stedet er full vekt på en trent klinikeres ferdigheter til å foreta en evaluering som i stor grad bygger på en persons svar på en serie standardspørsmål. Diagnostikk kompliseres ytterligere av det faktum at depresjon kan vises på flere måter - fra apati til agitasjon til ekstreme spise- eller sovemønstre.
Så forestillingen om at kunstig intelligens kan bidra til å forutsi om en person lider av depresjon, er potensielt et stort skritt fremover - om enn en som bringer med seg spørsmål om hvordan den kan brukes.
Det som gjør det mulig, sier Tuka Alhanai, forsker ved MITs datavitenskap og kunstig intelligenslaboratorium (CSAIL), er evnen til en maskinlæringsmodell til å identifisere tale- og språkmønstre assosiert med depresjon. Enda viktigere, modellen hun og stipendiat MIT-forskeren Mohammad Ghassemi utviklet, var i stand til å gjenkjenne depresjon med relativt høy grad av nøyaktighet gjennom å analysere hvordan folk snakker, i stedet for deres spesifikke svar på spørsmål fra en kliniker.
Det er det Alhanai refererer til som "kontekstfri" analyse; med andre ord, modellen tar sine signaler fra ordene folk velger og hvordan de sier dem, uten å prøve å tolke betydningen av utsagnene deres.
"I stedet for å fortelle modellen å fokusere på svar på spesifikke spørsmål, er den programmert til å finne ut på egen hånd hva den vil fokusere på, " sier hun.
Den potensielle fordelen, konstaterer Alhanai, er at denne typen nevrale nettverkstilnærminger en dag kan brukes til å evaluere en persons mer naturlige samtaler utenfor et formelt, strukturert intervju med en kliniker. Det kan være nyttig i å oppmuntre folk til å søke profesjonell hjelp når de ellers ikke kan skyldes kostnader, avstand eller ganske enkelt manglende bevissthet om at noe er galt.
"Hvis du vil distribuere modeller på en skalerbar måte, " sier hun, "vil du minimere mengden begrensninger du har for dataene du bruker. Du vil distribuere den i enhver vanlig samtale og få modellen til å plukke opp, fra det naturlige samspillet, individets tilstand. ”
Spotting mønstre
Modellen fokuserte på lyd, video og transkripsjoner fra 142 intervjuer av pasienter, hvorav rundt 30 prosent hadde blitt diagnostisert med depresjon av klinikere. Konkret brukte den en teknikk kalt sekvensmodellering, der sekvenser av tekst- og lyddata fra både deprimerte og ikke-deprimerte mennesker ble matet inn i modellen. Fra det dukket det opp forskjellige talemønstre for mennesker med og uten depresjon. For eksempel kan ord som "trist", "lavt" eller "ned" ha en tendens til å bli parret med stemmesignaler som er flatere og mer monotone.
Men det var opp til modellen å bestemme hvilke mønstre som stemte overens med depresjon. Så anvendte det det den lærte å forutsi hvilke nye fag som var deprimerte. Til syvende og sist oppnådde den en suksessrate på 77 prosent for å identifisere depresjon.
Forskerne fant også at modellen trengte betydelig mer data for å forutsi depresjon utelukkende fra hvordan en stemme hørtes ut, i motsetning til hvilke ord en person brukte. Når sistnevnte fokuserte utelukkende på tekst, trengte modellen å analysere et gjennomsnitt på bare syv sekvenser for å forutsi depresjon. Men når du bare bruker stemmelyd, krevde det 30 sekvenser. Det tyder på at ordene en person velger er en bedre prediktor for depresjon enn hvordan de høres ut.
Algoritmisk overreaksjon?
Det er fremdeles altfor tidlig å si hvordan en AI-modell kan innarbeides i depresjonsdiagnose. "Det er et skritt mot å kunne analysere flere frie-form interaksjoner, men det er bare et første skritt, " sier James Glass, senior forsker i CSAIL. Han bemerker at testprøven var "liten." Han sier også at forskerne vil prøve å bedre forstå hvilke spesifikke mønstre fra alle rå data modellen identifiserte som indikasjon på depresjon.
"Disse systemene er mer troverdige når du har en forklaring på hva de plukker opp, " sier han.
Det er viktig fordi hele ideen om å bruke AI i diagnostisering av psykiske helsetilstander er blitt møtt med sin del av skepsis. Det brukes allerede i terapibatboter, for eksempel Woebot, men å være involvert i faktisk diagnose vil ta rollen som maskiner til et annet nivå.
Den kanadiske legen Adam Hofmann, som nylig skrev i Washington Post, advarte om de mulige konsekvensene av det han omtalte som "algoritmisk overreaksjon."
"Kan falske positiver, for eksempel, føre til at mennesker som ennå ikke er deprimert, skal tro at de er det, " skrev han. ”Ens mentale helse er et sammensatt samspill av genetiske, fysiske og miljømessige faktorer. Vi kjenner til placebo- og noceboeffektene i medisinen, når blinde brukere av sukkerpiller opplever enten de positive eller negative virkningene av et legemiddel fordi de enten har positive eller negative forventninger til det.
"Å bli fortalt at du er dårlig kan bokstavelig talt gjøre det slik."
Hofmann vakte også bekymring for hvor lenge konklusjonene av slike AI-diagnostiske verktøy kunne holdes fra tredjeparter, for eksempel forsikringsselskaper eller arbeidsgivere. Denne angsten for potensielle overgrep gjennom "depresjonsdetektorer" ble også sitert i et nylig blogginnlegg på The Next Web.
Alhanai og Glass har hørt de bekymrede spekulasjonene om risikoen ved å stole for mye på AI-modeller for psykisk helse diagnose. Men de sier at forskningen deres er rettet mot å hjelpe klinikere, ikke å erstatte dem.
"Vi håper at vi kan tilby en utfyllende analyse, " sier Glass. “Pasienten er ikke hos legen hele tiden. Men hvis pasienten snakker hjemme på telefonen sin, kanskje tar opp en dagbok, og maskinen oppdager en endring, kan det signalisere til pasienten at de bør kontakte legen.
"Vi ser ikke på teknologien som tar beslutninger i stedet for klinikeren, " legger han til. ”Vi ser på det som å gi en annen inputmetrik til klinikeren. De vil fortsatt ha tilgang til alle nåværende innganger de bruker. Dette ville bare gi dem et annet verktøy i verktøykassen. "