https://frosthead.com

Kysse språkbarrierer farvel

I lang tid har den universelle oversetteren vært en besettelse av popkultur. Star Trek presenterer den som en håndholdt maskin, som ligner en mikrofon, som kan oversette de fleste språk umiddelbart . The Hitchhiker's Guide to the Galaxy kan skilte med en Babel-fisk, en skapning som, når den sitter fast i øret, gir øyeblikkelig oversettelse av ethvert språk i galaksen.

Så det burde ikke komme som noen overraskelse at dagens mennesker prøver å lage et apparat som fungerer like bra. Dusinvis av apper for smarttelefoner med oversettelse finnes, men de fleste oversetter ord på en enkel, en-til-en-basis; en bruker skriver inn eller snakker et ord, og appen spretter tilbake med en oversettelse. Nå er målet, og den virkelige pengefallet, for ingeniører og gründere å gjøre det mulig for to personer å snakke på forskjellige språk, mens et lite apparat spytter ut oversettelser i sanntid.

Eksisterende oversettelsesapper

På en tur til Hellas ble engelsktalende Andrew Lauder syk.

"Jeg gikk på apoteket, og de kunne ikke forstå noe engelsk, så jeg fikk ingen medisiner, " sier Lauder, administrerende direktør i Vocre Translate. Medikamentetikettene var ganske bokstavelig gresk for ham. Språkbarrierer er vanlig for verdens reisende. I et fremmed land blir små transaksjoner som å kjøpe medisin eller få veibeskrivelse - en annen vanskelighetsgrad som Lauder møtte - bli herculean oppgaver.

Da han kom tilbake til staten, opprettet Lauder Vocre Translate, en tale- og tekstoversettelsesapp. Det begynte som en tekst-til-tekst-app (kalt MyLangauge), og forvandlet deretter til en tale-til-tekst-modell som, i likhet med andre apper, inkludert SayHi Translate, brukte en tradisjonell modell der et ord oversettes direkte til et annet ord. Si "Hallo", og smarttelefonen eller nettbrettet kvitrer tilbake en automatisert "Hola." "Farvel" blir "Sayonara." Og så videre, omtrent som en tekstoversetter.

For å lage den enkle lydoversettelsen trengte skaperne av disse appene data. Vocre hentet informasjonen fra opptak og dokumenter fra public domain, for eksempel gamle filmer eller offentlige høringer. "Vi ba i utgangspunktet om en tale-posttranskripsjonstjeneste for å la oss bruke skyen deres for talegjenkjenning, " sier SayHi-administrerende direktør Lee Bossier.

Når ingeniørene hadde lyd- og tekstdata, koblet de lyden og teksten ord for ord. Programvare for stemmegjenkjenning gjenkjenner “ost” og konverterer det til tekst. Det er konvertert til fransk, og appen finner den franske uttalen for "fromage."

Når det er sagt, hvis en bruker cheekily kaller noe "cheesy", fungerer ikke oversetteren like bra, fordi talespråk ikke er så statisk som skriftspråk. Kadens, slang, bøyning, uttale, dialekt og samtale flyt kan endre mening

Over tid ønsket Lauder imidlertid en mer samtaleenhet. I en e-post sier han: "Basert på bruksdataene våre har vi funnet ut at folk snakker veldig forskjellig fra måten de skriver på. Det talte ordet er mye mer spontant og mye mindre formelt og bokstavelig. ”Så han benyttet statistisk maskinoversettelse, en tilnærming også brukt av Google som bruker data for å finne vanlig ordbruk, og går fra den tradisjonelle ord-til-ord-oversettelsesmodellen. I utgangspunktet lærer Vocre hvordan den brukes. ”Den lærer basert på hver samtale, hver setning som går gjennom den. Det er noe som blir smartere over tid, sier Lauder.

For øyeblikket tar det for øyeblikket begge appene noen sekunder å oversette, men er uten tvil effektive, spesielt i samsvar med kroppsspråk, for transaksjonelle samtaler som å bestille et måltid. Tross alt har mennesker bestilt mat på ikke-morsmål i mange år og klarer alltid å spise. Men de har ikke vært i stand til å ha dyptgående, sammensatte samtaler.

Med Vocre og SayHi kan samtaler stive sprikende, men det er ikke det samme som å chatte på morsmålet ditt. Google har til hensikt å endre dette helt.

Googles tilnærming (statistisk maskinoversettelse)

Når vi lærer et nytt språk på skolen, begynner vi med individuelle ordforhold. Men språk er mer flytende - ord trenger kontekst.

"Tilnærmingen [Google] tar er en mer generell tilnærming, " sier Josh Estelle, programvareingeniør for Google Translate. "I stedet for å prøve å kode alle disse reglene, prøver vi å lære reglene ved å se på data."

Teknologiselskapet unngår en-til-en-ord-for-ord-metoden og benytter i stedet statistisk maskinoversettelse, og ser ikke på hva ord betyr, men hvordan språk modelleres, som det lærer gjennom data . Så det sikter mot skogen, ikke trærne. Et engelsk eksempel: vi kjenner definisjonene av ordet "break" og "up." Men uttrykket "break up" er ikke den bokstavelige kombinasjonen av de to ordene.

Statistisk maskinoversettelse krever data. Fjell av den. For at metoden skal fungere, trenger den ikke bare det faktum at “fraage” er fransk for ost, men 100 eksempler på at både “fraage” og ost brukes i faktiske setninger.

Estelle sier at hvis en engelsktalende har to menyer, identisk med mindre det er skrevet på engelsk og en på kinesisk, "kan du sannsynligvis finne ut hva den kinesiske karakteren er for 'suppe.'" Kontekst er konge. Men for å skape den konteksten, trenger du tilgang til millioner av menyer, og alle andre dokumenter tenkelige.

Noe som Google har. Uten nettgiganten for å samle massevis av data, kunne en ekte Babel-fisk ikke eksistere. Den gjennomsøker nettet og samler alt - tekst og lyd. Deretter mater den disse dataene inn i algoritmer som sammenligner alt med alt annet. Disse sammenligningene hjelper deg med å komme til roten til hvordan språk naturlig fungerer.

"En ting som overrasker folk når vi snakker om Translate, er at teamet vårt ikke har noen språklister på det, " sier Estelle. "Vi har lansert 71 språk, og jeg vil si at teamet vårt ikke vet hvordan de skal snakke de aller fleste av dem. En menneskelig oversetter vil ikke kunne lære alle disse begrepene og tingene så raskt som [dataene] våre kan lære fra nettet. "

Hva er poenget?

I likhet med Google ser Facebook fordeler. Tenk på det sosiale mediet nettstedets eget forsøk på oversettelse.

"Oppdraget til Facebook har koblet sammen hele verden, og en av hindringene for å koble verden sammen er at ikke alle snakker det samme språket, " sier Tom Stocky, ingeniørdirektør i Facebook. "På oversettelsessiden tror jeg den virkelig ambisiøse fremtidsvisjonen er om du kan bruke Facebook på morsmålet ditt og samhandle med andre språk."

Den siste august kjøpte Facebook Jibbigo, en tale-til-tale-oversettelses-app som er tilgjengelig for Android og iOS-enheter.

Keen Facebook-brukere vil merke at det sosiale nettstedet allerede bruker en viss oversettelse. Hvis du noen gang har hatt et spansk innlegg på din engelsk-baserte side, har du umiddelbart fått muligheten til å oversette det til morsmålet ditt.

Men Stocky ser stemmekomponenten som en potensiell spillbytter. Fremveksten av smarttelefoner og nettbrett ønsker en evig sammenkoblet verden velkommen, og fremveksten av programvare for talegjenkjenning inviterer til nye måter å samhandle på nettet. Stocky ser for seg en fremtid der brukere bare kan snakke en kommando til smarttelefonene sine og samhandle med andre brukere, språkforskjeller til side.

"Det er ikke noe spørsmål som vil skje etter hvert, fordi de eneste begrensningene der er kraften til språkmotoren og selvfølgelig behandlingstid og prosessorkraft, " sier han.

Laura Murphy, professor i instituttet for globale helsesystemer og utvikling ved Tulane University og en innrømmet teknologiskeptiker, stiller spørsmål ved verdien av en universell oversetter, og trenger ikke å vite mer enn ett språk.

Hun tror enheten kan være noe nyttig med reiser, forretninger og internasjonale forhold, men ikke banebrytende. På et visst nivå har vi allerede oversettere (mennesker) på plass, og de fleste som jobber i utenriksrelasjoner kjenner de aktuelle språkene. En enhet, mener Murphy, kan ha negative konsekvenser.

"Jeg tror det kan gjøre folk late, " sier Murphy. Å oversette språk kan være mentalt utfordrende ved å tvinge hjernen - spesielt et som vet mer enn to språk - til å jobbe på en annen måte, men øvelsen er likevel givende. Hjernen trekker fra et sted med språklig empati som til og med den fineste stemmeviseren aldri kunne nå.

Selv om denne universelle kommunikasjonen kan være en positiv, erkjenner Murphy, “kan det føre til at folk tenker at de kommuniserer når de ikke er det.” Kultur er ikke alltid fullstendig nedfelt i språk (ta sarkasme, for eksempel), og kommunikasjon er ikke alltid om informasjonen som blir gitt.

Når kan vi forvente å se denne teknologien?

"I 2005 tok det oss 40 timer å oversette 1000 setninger, " sier Estelle, fra Google. "I dag oversetter vi tilsvarende 1000 setninger hvert 10. millisekund."

Som Richard Anderson berømt sier på TV-serien The Six Million Dollar Man på 1970-tallet, “Vi har teknologien.” Nå handler det bare om å vente på innsamling og analyse av data. Hvor lang tid det vil ta er fortsatt ukjent, ifølge Estelle. Men forsiktige estimater legger en slik enhet i hendene våre i løpet av et tiår.

Selv om appskapere som Bossier eller gigantiske selskaper som Google og Facebook ikke ønsker å bygge sine egne versjoner av Bibelske tårnet i Babel, vil de få slutt på babbling. Den ser for seg en verden der vi alle kommuniserer, om medisin, om politikk, om ideer.

Og den verdenen er kanskje ikke langt unna.

Redaktørens merknad: Vi oppdaterte denne historien 4. april 2014, for å beskrive Vocre Translate-teknologien nøyaktig.

Kysse språkbarrierer farvel