![googlestt](/f/ae032ef68ea8b48959e5be67fd1895d3.png)
Koncom minulého mesiaca spoločnosť Google vydala svoje Cloud prevod textu na reč vývojárom z celého sveta, ktorý obsahoval 32 rôznych hlasov v 12 jazykoch a variantoch. Teraz spoločnosť vydala veľkú aktualizáciu pre ďalší produkt zo svojej zostavy reči Cloud AI – nástroj Cloud Speech-to-text (predtým známy ako Cloud Speech API).
Cloud Speech-to-text engine, ktorý bol vydaný už v roku 2016, je vývojárom k dispozícii už takmer rok. S najnovšou verziou však Google pridal do motora množstvo nových funkcií a aktualizácií od ktorej sa očakáva, že bude oveľa užitočnejšia pre firmy, vrátane telefonovania a videa prepis. Nič však nebráni vývojárom spotrebiteľských aplikácií používať tieto motory na vytváranie aplikácií.
Podľa Google príspevok v blogu, nový a aktualizovaný nástroj Cloud Speech-to-Text teraz podporuje:
- Výber vopred zostavených modelov pre lepšiu presnosť prepisu z telefónnych hovorov a videa
- Automatická interpunkcia na zlepšenie čitateľnosti prepísaného dlhého zvuku
- Nový mechanizmus (metadáta rozpoznávania) na označovanie a zoskupovanie úloh prepisu a poskytovanie spätnej väzby tímu Google
- Štandardná dohoda o úrovni služieb (SLA) so záväzkom 99,9% dostupnosti
Aspoň niekoľko z nich by mohlo mať spotrebiteľské aplikácie v reálnom svete – napríklad použitie nástroja na prepis hlasových nahrávok.
Nové modely prepisu videa a telefonických hovorov však boli špeciálne navrhnuté pre obchodné použitie prípady, ako napríklad v call centrách, kde je potrebné sledovať všetku komunikáciu medzi spoločnosťou a zákazníkov.
Rozhranie API môže podporovať až 4 reproduktory pre telefónne hovory a viac ako 4 reproduktory pre videohovory, pričom bez problémov zohľadňuje hluk na pozadí, statickú elektrinu z telefónnej linky a iných agentov.
![Google Speech to Text](/f/5468d41ce3cb6e561d0c4db400628657.jpg)
Ak chcete model trénovať, Google použili skutočné údaje od zákazníkov, ktorí sa dobrovoľne prihlásili k poskytnutiu údajov výmenou za získanie prístupu k vylepšeniam. Vďaka použitiu reálnych údajov má nový model teraz o 54 % menej chýb ako predchádzajúci model. V blogovom príspevku Dan Aharon, produktový manažér cloudovej AI v spoločnosti Google, napísal:
„Väčšina veľkých cloudových poskytovateľov využíva údaje o reči z prichádzajúcich požiadaviek na zlepšenie svojich produktov. V službe Google Cloud sme sa tejto praktike vyhli, no zákazníci bežne požadujú, aby sme na zlepšenie našich modelov používali skutočné údaje, ktoré reprezentujú ich. Chceme naplniť túto potrebu a zároveň myslieť na súkromie a dodržiavať naše zásady ochrany údajov. To je dôvod, prečo dnes predstavujeme jeden z prvých programov na prihlásenie do denníka na zaznamenávanie údajov a predstavujeme prvý model založený na týchto údajoch.
Odporúčané články
![google prúdy](/f/7d2c32372ab584f14a91e93c8a9a8347.jpg)
![Webová stránka so šnúrkami](/f/61c2037ab5ab6fa8e71e6ab8c99959a3.jpg)
![Webová stránka Google Plus Shutterstock](/f/7010ce459e5d45f4e068de3c90b641d6.jpg)
![Webová stránka Google Plus Shutterstock](/f/7010ce459e5d45f4e068de3c90b641d6.jpg)
![Weeos redizajn odporúčaného webu](/f/3c7413d18316772d1512bca0827a1511.jpg)
![Google Lens](/f/d321d2a6b29ee30f7444878528ea4ad8.jpg)