Potřebujete vytvořit aplikace s přirozeným hlasovým projevem? Odpověď na Vaši otázku je služba Text to Speech.
Pomocí služby Text to Speech můžete vytvářet aplikace a služby s přirozeným hlasovým projevem. Tato funkce je součástí služby Speech. Zahrnuje rozsáhlou nabídku jazyků a také vám poskytuje možnost vytvářet realistické hlasy, díky funkci Neutral Text to Speech. Tato funkce Vám umožňuje vytvořit jedinečný hlas pro vaše řešení.
Funkce
Díky této službě můžete získat realistickou řeč, plynulou a přirozeně znějící. Tato řeč odpovídá vzorcům větného přízvuku a intonaci lidské řeči. Přináší zřetelnou artikulaci a intonaci podobnou lidské. Využívá hluboké neutrální sítě, díky kterým se hlasy nedají skoro rozeznat od přirozeného hlasu. Funkce zahrnuje již více než 80 hlasů a 45 jazyků a jejich variant. Lze vytvářet jedinečné a rozpoznatelné hlasy a vyladit hlasový výstup, upravováním jeho rychlosti, hlasitosti a výslovnosti.
S využitím kontejnerů můžete službu Text to Speech spouštět jak v cloudu, tak i v místním prostředí. Kontejnery podporují standartní i vlastní hlasy.
Custom Voice
Funkce Vlastní neutrální hlas (Custom Voice) umožňuje vytvořit jedinečný hlas, jen na základě pár minut zvuku pro trénink. Díky modelům hluboké neutrální sítě můžete vytvořit vlastní reálný hlas, který je podobný lidskému. Lze využít v reálném čase a při syntéze dlouhého zvukového obsahu.
Postup, který vidíte na obrázku najdete níže v číslovaném seznamu.
- Vytvořte prostředek Speech předtím, než začnete trénovat svůj hlas.
- Nahrajte svá data na portál Custom Voice nebo prostřednictvím vlastního hlasového rozhraní API a zkontrolujte kvalitu.
- Pomocí svých dat můžete trénovat svůj hlas. Zkontrolujte si svůj hlas, až bude připraven.
- Nasaďte svůj hlasový model, abyste získali vlastní endpoint rozhraní API. Před integrací do vašeho systému zkontrolujte endpoint.
- Použijte hlas ve vašich aplikacích pomocí vzorků kódu z endpointu.
Ladění hlasu
Pomocí funkce Ladění hlasu můžete také upravovat parametry vašeho výstupu jako jsou: rychlost, výslovnost, výška hlasu, hlasitost, intonace a pauzy. S pomocí neutrálních hlasů pak můžete upravovat styl řeči a z řeči neživé bytosti pak můžete udělat projev, zahrnující emoce, jako je radost nebo empatie. Umožní vám také používat formální nebo neformální tón podle situace, kterou potřebujete.
Postup, který vidíte na obrázku najdete níže v číslovaném seznamu.
- Vytvořte si účet Azure a získejte předplatné.
- Vytvořte soubor pro optimalizaci zvuku pomocí prostého textu nebo SSML.
- Vyberte hlas a jazyk, který chcete ladit.
- Pomocí nástroje pro vyladění upravte výslovnost, rozteč, rychlost, výbuchy, styl hlasu a další.
- Uložte a exportujte vyladěné zvuky.
- Použijte vlastně laděný hlas ve vašich aplikacích a produktech.
Využití v praxi
Služba Text to Speech je velice užitečná. Jako příklad jejího využití může být předčítání knih, když cestujete a nemůžete je držet nebo umožnění handicapovaným lidem, kteří nemohou číst, poslechnout si obsah celé knihy. Ve školách může tato služba pomoci dětem i učitelům s učením se cizích jazyků s rodilým mluvčím.
Ceník
Shrnutí
Tato služba vám ušetří čas a práci. Umožní vám získat realistické hlasy do vašich aplikací a řeč, která je přirozeně znějící. Je to velice praktická služba, která vám ulehčí život.
Přečtěte si dále:
- Speech to Text – úvod
- Speech to Text – v praxi
- Text Analytics – úvod
- Jak naprogramovat aplikaci, která vyhledá klíčový obsah textu
Odkazy
Podklady v anglickém jazyce na: https://azure.microsoft.com/en-us/services/cognitive-services/text-to-speech/
Podklady v českém jazyce na: https://azure.microsoft.com/cs-cz/services/cognitive-services/text-to-speech/
Další dokumentace o funkci Custom Voice na: https://speech.microsoft.com/customvoice
Další dokumentace o funkci Ladění hlasu na: https://docs.microsoft.com/cs-cz/azure/cognitive-services/speech-service/how-to-audio-content-creation
Rozšiřující informace o Instalaci a spuštění kontejnerů na: https://docs.microsoft.com/cs-cz/azure/cognitive-services/speech-service/speech-container-howto?tabs=stt%2Ccsharp
Podrobný ceník na: https://azure.microsoft.com/cs-cz/pricing/details/cognitive-services/speech-services/