Alexa går ned i det konverserende kaninhul – TechCrunch

0
Alexa går ned i det konverserende kaninhul – TechCrunch

På scenen ved re:Mars i denne uge fremviste Amazon en Alexa-funktion, der udvikler sig, beregnet til at efterligne strømmen af ​​naturligt sprog. Samtale mellem to mennesker følger sjældent en foruddefineret struktur. Det går mærkelige og uventede steder hen. Et emne går over i et andet, efterhånden som deltagerne tilfører deres levede oplevelse.

I en demo bliver en samtale om træer til en om vandreture og parker. I forbindelse med virksomhedens AI omtaler senior vicepræsident og chefforsker for Alexa, Rohit Prasad, fænomenet som “samtaleudforskning.” Det er ikke et rigtigt navn for en ordentlig funktion, præcis. Der er ikke en kontakt, der bliver vendt for pludselig at aktivere samtaler natten over. Det er snarere en del af en forestilling om, hvordan Alexa kan interagere med brugere på en mere menneskelig – eller måske mere human – måde.

Smarte assistenter som Alexa har traditionelt givet en meget mere forenklet spørgsmål-og-svar-model. Spørg Alexa om vejret, og Alexa fortæller dig vejret i et forudbestemt område. Spørg hende om A’s score (eller, ærligt talt, sandsynligvis ikke), og Alexa fortæller dig A’s score. Det er en ligetil interaktion, ikke ulig at skrive et spørgsmål i en søgemaskine. Men igen, samtaler i den virkelige verden udspiller sig sjældent på denne måde.

“Der er en lang række spørgsmål, Alexa får, som er meget informationsbærende. Når disse spørgsmål opstår, kan du forestille dig, at de ikke er punktspørgsmål,” fortalte Prasad TechCrunch i en samtale ved begivenheden. ”De handler virkelig om noget, kunden gerne vil lære mere om. Det, vi tænker på lige nu, er, hvad der sker med inflationen. Vi får sådan et væld af anmodninger til Alexa, og det giver dig den slags udforskningsoplevelse.”

Sådanne samtalefunktioner er imidlertid den måde, en hjemmeassistent som Alexa ramper op til. Otte år efter at være blevet lanceret af Amazon, lærer assistenten stadig – indsamler data og bestemmer de bedste måder at interagere med forbrugerne på. Selv når noget når til det punkt, hvor Amazon er klar til at vise det frem på en keynote-scene, er der stadig behov for justeringer.

“Alexa skal være ekspert i mange emner,” forklarede Prasad. ”Det er den store paradigmeændring, og den slags ekspertise tager et stykke tid at opnå. Dette bliver en rejse, og med vores kunders interaktioner vil det ikke være sådan, at Alexa fra dag ét ved alt. Men disse spørgsmål kan udvikle sig til flere udforskninger, hvor du ender med at gøre noget, du ikke troede, du var.”

At se ordet “Empati” med store fede bogstaver på scenen bag Prasad var en hoved-turner – men måske ikke så meget som det, der kom derefter.

Der er nogle ligetil scenarier, hvor begrebet empati kan eller bør inddrages under en samtale med både mennesker og smarte assistenter. Tag for eksempel evnen til at læse sociale signaler. Det er en færdighed, vi opfanger gennem erfaring – evnen til at læse det til tider subtile sprog i ansigter og kroppe. Følelsesmæssig intelligens for Alexa er en forestilling, som Rashad har diskuteret i årevis. Det starter med at ændre assistentens tone til at reagere på en måde, der formidler lykke eller skuffelse.

Bagsiden bestemmer følelsen af ​​en menneskelig højttaler, et koncept som virksomheden har arbejdet på at perfektionere i flere år. Det er arbejde, der har manifesteret sig på forskellige måder, herunder 2020-debuten af ​​virksomhedens kontroversielle wearable Halo, som tilbyder en funktion kaldet Tone, der foregav at “analysere energi og positivitet i en kundes stemme, så de kan forstå, hvordan de lyder for andre og forbedre deres kommunikation og relationer.”

“Jeg tror, ​​at både empati og affekt er velkendte måder at interagere på med hensyn til at opbygge relationer,” sagde Prasad. “Alexa kan ikke være tonedøv over for din følelsesmæssige tilstand. Hvis du gik ind, og du ikke er i godt humør, er det svært at sige, hvad du skal gøre. En, der kender dig godt, vil reagere på en anden måde. Det er en meget høj bar for AI, men det er noget, du ikke kan ignorere.”

Direktøren bemærker, at Alexa allerede er blevet en slags følgesvend for nogle brugere – især blandt de ældre demografiske. En mere samtaletilgang ville sandsynligvis kun forbedre dette fænomen. I demoer af Astro i denne uge omtalte virksomheden ofte, at hjemmerobotten udfylder en næsten kæledyrslignende funktion i hjemmet. Sådanne forestillinger har dog deres begrænsninger.

“Det skal ikke skjule det faktum, at det er en kunstig intelligens,” tilføjede Prasad. “Når det kommer til sagen [where] det er ikke til at skelne – hvilket vi er meget langt fra – det burde stadig være meget gennemsigtigt.”

En efterfølgende video demonstrerede en imponerende ny stemmesynteseteknologi, der bruger så lidt som et minuts lyd til at skabe en overbevisende tilnærmelse af en person, der taler. I den læser en bedstemors stemme hendes barnebarn “Troldmanden fra Oz.” Ideen om at mindes kære gennem maskinlæring er ikke helt ny. Virksomheder som MyHeritage bruger for eksempel teknologi til at animere billeder af afdøde slægtninge. Men disse scenarier rejser uvægerligt – og forståeligt nok – nogle hackles.

Prasad var hurtig til at påpege, at demoen mere var et proof of concept, der fremhævede de underliggende stemmeteknologier.

“Det handlede mere om teknologien,” forklarede han. “Vi er en meget kundebesat videnskabsvirksomhed. Vi ønsker, at vores videnskab skal betyde noget for kunderne. I modsætning til mange ting, hvor generation og syntetisering er blevet brugt uden de rigtige porte, føles dette som en kunder ville elske. Vi er nødt til at give dem det rigtige sæt kontroller, inklusive hvis stemme det er.”

Med det i tankerne er der ingen tidslinje for en sådan funktion – hvis en sådan funktion faktisk nogensinde vil eksistere på Alexa. Direktøren bemærker dog, at teknologien, der ville drive det, er meget oppe at køre i Amazon Labs. Selvom det igen, hvis det kommer, ville det kræve noget af den førnævnte gennemsigtighed.

“I modsætning til deepfakes, hvis du er gennemsigtig omkring, hvad det bliver brugt til, er der en klar beslutningstager, og kunden har kontrol over deres data, og hvad de vil have dem brugt til, tror jeg, at dette er det rigtige sæt trin “, forklarede Prasad. “Det her handlede ikke om ‘død bedstemor’. Bedstemoren er i live i denne, bare for at være meget klar over det.”

På spørgsmålet om, hvordan Alexa kan se ud 10 til 15 år i fremtiden, forklarer Prasad, at det hele handler om valg – dog mindre om at præge Alexa med individuelle og unikke personligheder end at tilbyde en fleksibel computerplatform til brugerne.

“Den burde være i stand til at udrette alt, hvad du vil,” sagde han. “Det er ikke kun gennem stemmen; det er intelligens på det rigtige tidspunkt, og det er her, omgivende intelligens kommer ind. Det bør proaktivt hjælpe dig i nogle tilfælde og forudse dit behov. Det er her, vi tager samtaleudforskningen længere ud. Alt hvad du leder efter – forestil dig, hvor meget tid du bruger på at booke en ferie [when you don’t] har et rejsebureau. Forestil dig, hvor meget tid du bruger på at købe det kamera eller det TV, du ønsker. Alt, hvad der kræver, at du bruger tid på at søge, burde blive meget hurtigere.”

lignende indlæg

Leave a Reply