Google vydáva najväčšiu generálnu opravu cloudového nástroja na prevod reči na text

googlestt

Koncom minulého mesiaca spoločnosť Google vydala svoje Cloud prevod textu na reč vývojárom z celého sveta, ktorý obsahoval 32 rôznych hlasov v 12 jazykoch a variantoch. Teraz spoločnosť vydala veľkú aktualizáciu pre ďalší produkt zo svojej zostavy reči Cloud AI – nástroj Cloud Speech-to-text (predtým známy ako Cloud Speech API).

Cloud Speech-to-text engine, ktorý bol vydaný už v roku 2016, je vývojárom k dispozícii už takmer rok. S najnovšou verziou však Google pridal do motora množstvo nových funkcií a aktualizácií od ktorej sa očakáva, že bude oveľa užitočnejšia pre firmy, vrátane telefonovania a videa prepis. Nič však nebráni vývojárom spotrebiteľských aplikácií používať tieto motory na vytváranie aplikácií.

Podľa Google príspevok v blogu, nový a aktualizovaný nástroj Cloud Speech-to-Text teraz podporuje:

  1. Výber vopred zostavených modelov pre lepšiu presnosť prepisu z telefónnych hovorov a videa
  2. Automatická interpunkcia na zlepšenie čitateľnosti prepísaného dlhého zvuku
  3. Nový mechanizmus (metadáta rozpoznávania) na označovanie a zoskupovanie úloh prepisu a poskytovanie spätnej väzby tímu Google
  4. Štandardná dohoda o úrovni služieb (SLA) so záväzkom 99,9% dostupnosti

Aspoň niekoľko z nich by mohlo mať spotrebiteľské aplikácie v reálnom svete – napríklad použitie nástroja na prepis hlasových nahrávok.

Nové modely prepisu videa a telefonických hovorov však boli špeciálne navrhnuté pre obchodné použitie prípady, ako napríklad v call centrách, kde je potrebné sledovať všetku komunikáciu medzi spoločnosťou a zákazníkov.

Rozhranie API môže podporovať až 4 reproduktory pre telefónne hovory a viac ako 4 reproduktory pre videohovory, pričom bez problémov zohľadňuje hluk na pozadí, statickú elektrinu z telefónnej linky a iných agentov.

Google Speech to Text

Ak chcete model trénovať, Google použili skutočné údaje od zákazníkov, ktorí sa dobrovoľne prihlásili k poskytnutiu údajov výmenou za získanie prístupu k vylepšeniam. Vďaka použitiu reálnych údajov má nový model teraz o 54 % menej chýb ako predchádzajúci model. V blogovom príspevku Dan Aharon, produktový manažér cloudovej AI v spoločnosti Google, napísal:

„Väčšina veľkých cloudových poskytovateľov využíva údaje o reči z prichádzajúcich požiadaviek na zlepšenie svojich produktov. V službe Google Cloud sme sa tejto praktike vyhli, no zákazníci bežne požadujú, aby sme na zlepšenie našich modelov používali skutočné údaje, ktoré reprezentujú ich. Chceme naplniť túto potrebu a zároveň myslieť na súkromie a dodržiavať naše zásady ochrany údajov. To je dôvod, prečo dnes predstavujeme jeden z prvých programov na prihlásenie do denníka na zaznamenávanie údajov a predstavujeme prvý model založený na týchto údajoch.

ZNAČKYGoogle+
Zanechať komentár

Odporúčané články

google prúdy
Webová stránka so šnúrkami
Webová stránka Google Plus Shutterstock
Webová stránka Google Plus Shutterstock
Weeos redizajn odporúčaného webu
Google Lens
Zanechať Odpoveď zrušiť odpoveď