Priljubljene Objave

Izbira Urednika - 2019

Če želite, da vas televizor bolje razume

Anonim

Nova raziskava iz Univerze v Waterloo je našla način za izboljšanje glasovne poizvedbe za razumevanje zmožnosti domačih zabavnih platform.

oglas


Raziskave v sodelovanju z Univerzo v Marylandu in Comcast Applied AI Research Lab uporabljajo tehnologijo umetne inteligence (AI), da dosežejo najbolj naravne govorne interakcije s televizorji do danes.

"Danes smo se navadili, da se pogovarjamo z inteligentnimi agenti, ki opravljajo naše ponudbe - od Sirija na mobilnem telefonu do Alexe doma. Zakaj ne bi mogli storiti enako s televizorji?" vprašal je Jimmy Lin, profesor na Univerzi v Waterloo in predsedujoči David R. Cheriton na šoli za računalništvo David R. Cheriton.

"Comcast's Xfinity X1 si prizadeva narediti ravno to - platforma ima" glasovno oddaljeno ", ki sprejema govorne poizvedbe. Vaša želja je njen ukaz - povejte svojemu TV-ju, da spremeni kanale, ga vprašajte o brezplačnih otroških filmih in celo o Vremenska napoved."

Pri reševanju zapletenega problema razumevanja glasovnih poizvedb so raziskovalci imeli idejo, da izkoristijo najnovejšo tehnologijo AI - tehniko, ki je znana kot hierarhična ponavljajoča nevronska omrežja - za boljši model konteksta in izboljšanje natančnosti sistema.

Januarja 2018 se je v proizvodnji razvil nov model nevronske mreže raziskovalcev, ki je odgovoril na vprašanja iz resničnih uporabnikov v živo. Za razliko od prejšnjega sistema, ki ga je zmedlo približno osem odstotkov poizvedb, novi model obravnava večino zelo zapletenih vprašanj, kar močno izboljšuje uporabniško izkušnjo.

"Če gledalec prosi za" Chicago Fire ", ki se nanaša na dramsko serijo in nogometno ekipo, sistem lahko razloži, kaj zares želite, " je dejal Lin. "Poseben pri tem pristopu je, da izkoristimo kontekst - kot so prej gledali predstavitve in priljubljeni kanali - da bi prilagodili rezultate in s tem povečali natančnost."

Raziskovalci so začeli razvijati še bogatejši model. Intuicija je, da lahko z analizo poizvedb iz več vidikov sistem bolje razume, kaj gledalec pravi.

V članku je bilo na 24. mednarodni konferenci ACM SIGKDD o odkrivanju znanja in podatkovnem rudarjenju, ki je potekalo nedavno v Združenem kraljestvu, predstavljen članek o učenju z večnimi nalogami z nevronskimi omrežji za glasovno poizvedbo o razumevanju platforme za zabavo. Raziskovanje je opravil Jinfeng Rao, doktorat iz Univerze v Marylandu, njegov svetovalec Lin in mentor Ferhan Ture, raziskovalec v Comcast Applied AI Research Lab.

oglas



Story Source:

Gradivo, ki ga ponuja University of Waterloo . Opomba: Vsebino lahko uredite za slog in dolžino.