Siri-ous business: Jak se virtuální asistenti postupně stávají neocenitelnými

Nepoužívám virtuální asistenty. Možná jsem v hloubi duše skeptický, že jsem natolik důležitý, abych zaručil asistenta, virtuálního nebo jiného, ​​nebo je to možná jen tím, že moje zkušenost s mluvením s mými zařízeními byla trochu ohromující. Od Siri a Google Now až po veselé pozdravy mého Xboxu One, jsem se cítil sebevědomě bez dostatečné odměny na to, aby celá ta rigmarole vypadala, že stojí za to.

Viz související 

Facebook využívá umělou inteligenci ke čtení fotek nevidomým
Inside Speech Graphics: vytváření virtuálních tváří budoucnosti
RIP Facebook M: Mark Zuckerberg potvrzuje, že odkládá rivala Siri a Cortanu

A tak jsem se díky intrikám zvenčí zúčastnil série přednášek společnosti Nuance, jednoho z největších světových výrobců softwaru pro rozpoznávání řeči a přepis. Možná to nezní jako běžné jméno, ale seznam klientů, se kterými spolupracují, je tak rozsáhlý, že je rychlejší uvést společnosti, se kterými nespolupracují, než ty, se kterými spolupracují. Zde však není zdaleka tak široký výběr: Roku, Panasonic, LG, Samsung, Lexus, Ford, BMW, Toyota, Vodafone, BT, T-Mobile, Domino’s, Coca-Cola, Barclays, Citi, Delta, Air France, FedEx, AT&T, BMW a NHS. Stručně řečeno, i když jméno Nuance nezní, pravděpodobně jste se s nimi do jisté míry vypořádali. AI se zabývají 14 miliardami zákaznických vztahů ročně v 80 různých jazycích.

Pokud se obáváte, že stejný virtuální asistent, který vybírá polevy na vaší pizze, také svítí v NHS, můžete si oddechnout. Ačkoli existují některé sdílené prvky, různé umělé inteligence mají velmi odlišné funkce – neexistuje zde žádná univerzální umělá inteligence. To je důvod, proč Nils Lenke, vrchní ředitel podnikového výzkumu ve společnosti Nuance Communications, nemá moc náklaďáků s myšlenkou, že AI převezme svět v brzké době, i když společnost věci bedlivě sleduje, spolupořádá Winograd Schema Challenge – nástupce Turingova testu.nuance_nils_lenke

„Základní technologie je velmi podobná, ale jakmile systém vycvičíte, může dělat pouze jeden úkol,“ vysvětluje. "Tento Go systém je velmi dobrý při hraní Go, ale nedokáže rozpoznat tváře ani nerozumí řeči. My [lidé] řešíme všechny své problémy stejným mozkem, ale to není to, co tyto systémy dělají. To je důvod, proč existuje dlouhá cesta k napodobování lidské inteligence – pokud vůbec někdy.“

Je skutečně možné, že neochota designérů jiných virtuálních asistentů přijmout tato omezení je kořenem toho, proč jsem zjistil, že mé dosavadní zkušenosti jsou tak ohromující. Dal jsem to Lenke: "Přesně tak, snaží se uvařit oceán, že?" Pokud je asistent příliš obecný, Lenke naznačuje, že si často nejste jisti, co vlastně dále očekávat a kde jsou jeho omezení lhát.

Místo toho se zdá, že omezením rozsahu virtuální asistentky je užitečnější. „Řekněme, že s asistentem řidiče je celkem jasné, jaké problémy má řidič. Všichni chtějí benzín, všichni potřebují vědět, co říká přístrojová deska, všichni potřebují něco k jídlu: je mnohem snazší postavit něco, co je užitečné pro řidiče."

„Před rokem nebylo mnoho volání po virtuálních asistentech, kteří by správně vyslovovali jméno Jeremyho Corbyna. poznamenává, zatímco jakákoli umělá inteligence, která vás dnes doplňuje do zpráv, by měla lépe vědět, jak vyslovit jméno labouristického vůdce správně."

Toto zjednodušení se týká i zahrnuté slovní zásoby. John West, hlavní architekt řešení ve společnosti Nuance, mi říká, že v zájmu zachování virtuálních asistentů syntetizované hlasy znějící plynule, slovník je často znovu navštěvován, aby bylo zajištěno, že budou zohledněny aktuální trendy pro. Před rokem nebylo moc volání po virtuálních asistentech, kteří by správně vyslovovali jméno Jeremyho Corbyna. poznamenává, zatímco jakákoli umělá inteligence, která vás dnes doplňuje do zpráv, by měla lépe vědět, jak vyslovit jméno labouristického vůdce správně. To je podle Lenke další důvod, proč je lepší virtuální asistentka specialized: „Snažíte se předvídat, co je doména, a generujete hlas na základě vzorků ta doména. Pokud se snažíte mít hlas, který dokáže říct vše z každé domény, kvalita se může zhoršit.“nuance_dragon_drive

"Pokud jde o pohlaví virtuálních asistentů, často to souvisí s kulturními rozdíly v jednotlivých zemích - některé z nich mají velmi hluboce zakořeněné a předepsané názory na to, které pohlaví je pro každý úkol správné."

Když už mluvíme o hlasech, něco, co mě na virtuálních asistentech vždy házelo, je potřeba, aby vůbec měli mužské nebo ženské tóny. Jaké místo má pohlaví pro umělou inteligenci? "Je to záměrná volba, kterou musíte udělat," říká Lenke a každý klient má poslední slovo. „Můžete buď říct, že jde o iluzi lidské bytosti, nebo můžete říct ‚Chci, aby lidé viděli, že je to robot‘, takže tomu dáte robotický hlas a není tam žádná persona. zapojený.” Pokud jde o pohlaví, je to často způsobeno kulturními rozdíly v jednotlivých zemích – některé z nich mají velmi hluboce zakořeněné a předepsané názory na to, které pohlaví je pro každého správné. úkol. Opět jde o volbu klienta, nikoli o to, aby Nuance vnutila klientovi své vlastní filozofie.

Samotné hlasy zní bohatě, plynule a přirozeně v ukázkách, které jsem ukázal. Teoreticky, mohli by se je někteří klienti pokoušet vydávat za lidi, nebo alespoň nezmínit, že jsou robot ve lži opomenutím? „Řeknu to takto: Osobně bych to nedoporučoval,“ varuje Lenke.

Ale jak užiteční jsou virtuální asistenti? Nuance má několik klíčových příkladů zlepšení pro podnikání, od hlasové biometrie, která překonává heslo, až po celou cestu aby pracovní spokojenost pracovníků call centra rostla, protože jejich nudné předběžné otázky jsou automaticky vyřizovány s. Ale možná nejcennější je zdravotnictví, jedna z nejvýznamnějších oblastí společnosti.

„Lékaři ve Spojeném království odvedou denně administrativní práci za tři a půl hodiny,“ vysvětluje Frederik Brabant, hlavní lékař pro lékařské informace společnosti Nuance. Je mi ukázáno několik ukázek, jedno, ve kterém může lékař dokončit 20 receptů přibližně o třetinu rychleji pomocí hlasu příkazy a další, kde zdravotník dostane všechny relevantní informace o svých různých pacientech iPad. Sémanticky se zdá, že systém dokonce vyzývá lékaře k podrobnostem, které možná zapomněli: například jaký typ cukrovky, takže jejich poznámky dávají při přenosu smysl. To může podle Brabantska vést ke zvýšení příjmů v průměru o 6 až 8 %.

Cílem je usnadnit práci lékařů, spíše než nahrazovat nebo rozšiřovat jejich odborné znalosti. "Doktoři to nenávidí." Nechceme dostávat pokyny. Stroj by nikdy neměl říkat ‚studoval jsi sedm let medicíny, ale…‘“ Navzdory omezením stále převážně papírové NHS používá Dragon Medical více než 80 % trustů v 

Spojené království s různým stupněm integrace. Pokud jde o budoucnost, existují využití mimo administrativu. Pokud pracujete na chirurgii, nemůžete ze zřejmých hygienických důvodů přistupovat k důležitým informacím rukama, takže hlasový asistent dává dokonalý smysl.nuance_localization_lab

A právě zde skutečně vstoupí do hry další pokroky, kterých se společnost chystá v budoucnu dosáhnout: učinit software inteligentnějším a logičtějším. Uvádím příklad: když svému autu řeknete: „Po mé poslední schůzce si zarezervujte stůl v Joe’s Pizza a dejte Tomovi vědět, seznamte se se mnou,“ ve skutečnosti se spoléháte na opojnou směs velkých znalostí, sémantického směrování, plánování, sémantiky a dialog. Potřebuje nahlédnout do vašeho kalendáře pro čas poslední schůzky, podívat se na mapu a zjistit, kde je Joe’s Pizza ve vztahu k místo schůzky, vyhledejte číslo na restauraci a zkuste rezervaci, poté vyhledejte Tomovy kontaktní údaje a odešlete a zpráva. To je působivé, ale chtějí, aby auto dokázalo najít kvalitní italské alternativy, pokud je Joe’s Pizza rezervováno, a navrhli časy, které budou vyhovovat všem. Teoreticky to není příliš daleko a stejně tak chytrý telefon, který dokáže lékaři sdělit počet červených krvinek pacienta za chodu, je k vzteku blízko. Lékaři však musí nejprve ztratit svou připoutanost k papíru a peru a přejít na 100% digitální technologii.

"Teoreticky to není příliš daleko a stejně tak chytrý telefon, který dokáže lékaři sdělit počet červených krvinek pacienta za chodu, je k vzteku blízko."

„Osobně si myslím, že v příštích čtyřech nebo pěti letech bude mít Spojené království v digitální transformaci mnoho příležitostí. a že nové technologie, jako je rozpoznávání hlasu a zpracování přirozeného jazyka, jej posunou na další úroveň,“ uzavírá Brabantsko.

Po opuštění akce a návratu do kanceláře jsem se rozhodl dát virtuálním asistentům další pokus. "OK Google," řeknu, "naviguj mě na Goodge Street." A dělá to ve dvojnásobně rychlém čase, takže mě nechává přemýšlet, jestli je v mé osobní kanceláři nakonec volné místo pro virtuální asistentku.

ČTĚTE DALŠÍ: 10 věcí, které musíte pochopit o umělé inteligenci