Text to Speech – úvod

9. 3. 2020 Azure, Programming

Potřebujete vytvořit aplikace s přirozeným hlasovým projevem? Odpověď na Vaši otázku je služba Text to Speech.

Pomocí služby Text to Speech můžete vytvářet aplikace a služby s přirozeným hlasovým projevem. Tato funkce je součástí služby Speech. Zahrnuje rozsáhlou nabídku jazyků a také vám poskytuje možnost vytvářet realistické hlasy, díky funkci Neutral Text to Speech. Tato funkce Vám umožňuje vytvořit jedinečný hlas pro vaše řešení.

Funkce

Díky této službě můžete získat realistickou řeč, plynulou a přirozeně znějící. Tato řeč odpovídá vzorcům větného přízvuku a intonaci lidské řeči. Přináší zřetelnou artikulaci a intonaci podobnou lidské. Využívá hluboké neutrální sítě, díky kterým se hlasy nedají skoro rozeznat od přirozeného hlasu. Funkce zahrnuje již více než 80 hlasů a 45 jazyků a jejich variant. Lze vytvářet jedinečné a rozpoznatelné hlasy a vyladit hlasový výstup, upravováním jeho rychlosti, hlasitosti a výslovnosti.

S využitím kontejnerů můžete službu Text to Speech spouštět jak v cloudu, tak i v místním prostředí. Kontejnery podporují standartní i vlastní hlasy.

Custom Voice

Funkce Vlastní neutrální hlas (Custom Voice) umožňuje vytvořit jedinečný hlas, jen na základě pár minut zvuku pro trénink. Díky modelům hluboké neutrální sítě můžete vytvořit vlastní reálný hlas, který je podobný lidskému. Lze využít v reálném čase a při syntéze dlouhého zvukového obsahu.

Postup, který vidíte na obrázku najdete níže v číslovaném seznamu.

Schéma funkce Custom voice
Schéma funkce Custom voice | Zdroj: microsoft.com
  1. Vytvořte prostředek Speech předtím, než začnete trénovat svůj hlas.
  2. Nahrajte svá data na portál Custom Voice nebo prostřednictvím vlastního hlasového rozhraní API a zkontrolujte kvalitu.
  3. Pomocí svých dat můžete trénovat svůj hlas. Zkontrolujte si svůj hlas, až bude připraven.
  4. Nasaďte svůj hlasový model, abyste získali vlastní endpoint rozhraní API. Před integrací do vašeho systému zkontrolujte endpoint.
  5. Použijte hlas ve vašich aplikacích pomocí vzorků kódu z endpointu.

Ladění hlasu

Pomocí funkce Ladění hlasu můžete také upravovat parametry vašeho výstupu jako jsou: rychlost, výslovnost, výška hlasu, hlasitost, intonace a pauzy. S pomocí neutrálních hlasů pak můžete upravovat styl řeči a z řeči neživé bytosti pak můžete udělat projev, zahrnující emoce, jako je radost nebo empatie. Umožní vám také používat formální nebo neformální tón podle situace, kterou potřebujete.

Postup, který vidíte na obrázku najdete níže v číslovaném seznamu.

Schéma funkce Ladění hlasu
Schéma funkce Ladění hlasu | Zdroj: microsoft.com
  1. Vytvořte si účet Azure a získejte předplatné.
  2. Vytvořte soubor pro optimalizaci zvuku pomocí prostého textu nebo SSML.
  3. Vyberte hlas a jazyk, který chcete ladit.
  4. Pomocí nástroje pro vyladění upravte výslovnost, rozteč, rychlost, výbuchy, styl hlasu a další.
  5. Uložte a exportujte vyladěné zvuky. 
  6. Použijte vlastně laděný hlas ve vašich aplikacích a produktech.

Využití v praxi

Služba Text to Speech je velice užitečná. Jako příklad jejího využití může být předčítání knih, když cestujete a nemůžete je držet nebo umožnění handicapovaným lidem, kteří nemohou číst, poslechnout si obsah celé knihy. Ve školách může tato služba pomoci dětem i učitelům s učením se cizích jazyků s rodilým mluvčím.

Ceník

 Tabulka cen za službu Text to Speech
Tabulka cen za službu Text to Speech | Zdroj: microsoft.com

Shrnutí

Tato služba vám ušetří čas a práci. Umožní vám získat realistické hlasy do vašich aplikací a řeč, která je přirozeně znějící. Je to velice praktická služba, která vám ulehčí život. Článek o podobné službě Speech to text najdete zde:

Odkazy

Podklady v anglickém jazyce na: https://azure.microsoft.com/en-us/services/cognitive-services/text-to-speech/

Podklady v českém jazyce na: https://azure.microsoft.com/cs-cz/services/cognitive-services/text-to-speech/

Další dokumentace o funkci Custom Voice na: https://speech.microsoft.com/customvoice

Další dokumentace o funkci Ladění hlasu na: https://docs.microsoft.com/cs-cz/azure/cognitive-services/speech-service/how-to-audio-content-creation

Další dokumentace o Instalaci a spuštění kontejnerů na: https://docs.microsoft.com/cs-cz/azure/cognitive-services/speech-service/speech-container-howto?tabs=stt%2Ccsharp

Podrobný ceník na: https://azure.microsoft.com/cs-cz/pricing/details/cognitive-services/speech-services/