https://frosthead.com

Å snakke med maskiner

Programvare for stemmegjenkjenning, de fleste av oss vil nok være enige, er en ganske kul ting. Men det å snakke med maskiner deler - det være seg smarttelefon, TV-skjerm eller dashbord - vel, ikke så mye. Ber du om et apparat? Reeks av geek. Vil du uttale hvert ord, slik at du kan bli forstått? Hvor kul kan du egentlig være?

Men Apple, sann til form, har tatt dette hodet på ved å ansette tre ikoner av kule å spille i deres siste annonsekampanje for Siri, stemmen til iPhone 4S. Det er Zooey Deschanel (Adorable Cool) og John Malkovich (Cerebral Cool) og Samuel L. Jackson (Ultimate Cool), og alle får det til å engasjere seg i ordspill a med en telefon som gudsporten.

Kritikere påpeker likevel at Siri i det virkelige liv verken er så lydhør eller allvitende som hun blir fremstilt i reklamefilmer. Også du er sikker på at du er sjokkert over å høre dette. Andre ser på hele saken som moden for parodi - se Zooys bror Jooey gjøre en morsom eller Die-versjon av Zooey og Siris regnfulle dag sammen.

Spiller ingen rolle. Siri har blitt en forsanger i robotens kor, “You Got Mail” -stemmen til en ny generasjon.

Det er fasjonabelt i noen kretser å antyde at Siri ikke er Steve Jobs-verdig, at hvis han fortsatt var i live, ville Jobs ha trukket den av markedet eller, i det minste, aldri ville ha godkjent en så høy profil kampanje for så feil produkt.

Men som Jobs 'etterfølger, Tim Cook, sa tidligere denne uken, iPhone 4S-eiere som Siri. I følge en undersøkelse som ble utgitt i mars, sier nesten 90 prosent at de bruker den minst en gang i måneden. Og husk at Siri, et av de få Apple-produktene som ble sagt i beta da det ble utgitt, ikke vil feire hennes første bursdag før i oktober. Hun lærer fremdeles språk, og enda viktigere, bare begynner å utnytte potensialet til kunstig intelligens.

Siri vil trolig være et midtpunkt i Apple TV, som forventes å debutere i desember. Men sjansen er stor for at stedet der vi snakker med maskiner kommer til å være mainstream er i våre biler.

Kjør, sa hun

Visst, det skjer allerede, men du må fortsatt bytte til robotprat hvis du vil bli forstått. Og selv da er det ingen garanti. Det vil begynne å endre seg i sommer når noen nye modeller kommer utstyrt med noe som heter Dragon Drive!

Det er oppfinnelsen av Nuance Communications, et Massachusetts-basert selskap som har blitt et kraftverk i stemmegjenkjenningsbransjen. (Det antas å være hjernen bak Siri.) Nyanse og stemmegjenkjenning i biler tok et stort sprang fremover i forrige uke da firmaet kunngjorde at Dragon Drive! vil kunne benytte seg av skyen.

Hva dette betyr er at systemet dramatisk vil øke sin datakraft og minneevne. Og det betyr at stemmen i dashbordet ditt blir mer Siri-aktig og lar deg faktisk snakke med den. Ikke mer monosyllabisk roping. Dagen kommer når du vil være i stand til å nevne tilfeldig at du føler at noen Allman Brothers og sekunder senere vil "Whipping Post" komme og pumpe gjennom høyttalerne.

Nøkkelen er hvor godt vi klarer å lære maskiner kontekst og pragmatikk - hvordan språk brukes i sosiale situasjoner. Og det er vanskelig virksomhet. Til å begynne med trenger selv den mest sofistikerte stemmegjenkjenningsenheten å vente på at et menneske er ferdig med å snakke, slik at den kan analysere og tolke hele setningen. Så er det "sinnsteorien", evnen til å forstå at andre mennesker kan ha andre oppfatninger og intensjoner enn vår egen. Så vidt vi vet, er det bare mennesker som kan gjøre dette.

En fersk undersøkelse av to Stanford-psykologer kan gi deg en følelse av hva som er involvert i å hjelpe maskiner intuit. Forskerne Michael Frank og Noah Goodman satte opp et eksperiment på nettet der deltakerne ble bedt om å se på et sett med objekter og deretter velge hvilken som ble henvist til å være et bestemt ord. For eksempel så en gruppe deltakere en blå firkant, en blå sirkel og en rød firkant. Spørsmålet for den gruppen var: Se for deg at du snakker med noen, og at du vil henvise til det midterste objektet. Hvilket ord vil du bruke, "blå" eller "sirkel"?

Den andre gruppen ble spurt: Se for deg at noen snakker med deg og bruker ordet “blå” for å referere til et av disse objektene. Hvilket objekt snakker de om?

Svarene hjalp forskerne med å få et tydeligere bilde av hvordan en lytter forstår en foredragsholder og hvordan en foredragsholder bestemmer hva de skal si. Fra det utviklet de den typen matematiske modeller som kan utvide og foredle datamaskinens tankeprosess.

Frank sa: "Det vil ta mange års arbeid, men drømmen er en datamaskin som virkelig tenker på hva du vil og hva du mener i stedet for bare det du sa."

En måte å tale på

Her er noen nyere utviklinger innen stemmegjenkjenning:

  • Siri går stille: IBM har en tendens til å være veldig nervøs for at bedriftshemmeligheter kommer ut, så det forbyr nå de ansatte å bruke offentlige filoverføringssider, for eksempel Dropbox. Men det har også forbud mot bruk av Siri på kontoret fordi sikkerhetsadministratorer bekymrer seg for at noen, mens de snakker med telefonen sin, kan avsløre sensitiv informasjon som havner på Apples servere.
  • Ta det, Apple !: Samsung lanserte sin nye Galaxy X III-smarttelefon i London denne uken, og mens den store berøringsskjermen får mye oppmerksomhet, har den også ny programvare for stemme og ansiktsgjenkjenning.
  • Gjør hva jeg sier, ikke hva jeg gjør: Og Samsung stopper ikke der. Den sendte nylig inn en patentsøknad for en robot som forstår menneskelig tale. Roboten vil kunne justere sine "lytte" -funksjoner for å ta hensyn til omgivelsesstøy som kan avbryte eller forstyrre kommandoer den har fått. Det vil også være i stand til å gjenkjenne hvem som snakker med det, selv om bakgrunnsstøyen er veldig høy.

Infografisk bonus: Du tror bilen din er datastyrt nå. Vent til den er koblet til Internett. Få lav pris på hva en tilkoblet bil kan gjøre.

Å snakke med maskiner