Form Recognizer – úvod

29. 4. 2020 Azure, Programming

Rozpoznávání ručně nebo elektronicky vyplněných dokumentů a formulářů nikdy nebylo snazší! Azure Form Recognizer je jedna z nejnovějších služeb Azure Cognitive Services. Nejedná se ale pouze o rozpoznávání textu, Form Recognizer jde ještě dále – textu dokonce přiřadí význam!

Co je to

Form Recognizer umožňuje jednoduše z digitálních dokumentů extrahovat text v podobě key-value pair (formát uspořádané dvojice <název parametru, hodnota>), tabulky nebo prostého textu. Největší výhodou Form Recognizeru je, že vyžaduje minimální množství dat k pochopení formuláře a podává rychlé, přesné a konzistentní výsledky. Data, která takto získáte, jsou šité na míru vašemu obsahu a to vše jednoduše, bez znalostí umělé inteligence. Form Recognizer využívá pro své volání REST API, proto je možné jej použít v široké řadě zařízení a aplikací.

Key-Value pair – data ve formátu uspořádané dvojice klíče a hodnoty <název parametru, hodnota>, např. „Address“, „123 Main Street Redmond, WA 98052“.

OCROptické rozpoznávání znaků – metoda, která umožňuje překlad tištěného nebo psaného textu do textu, s nímž lze pracovat jako s normálním počítačovým textem.

Fotografie účtenky

--------------------------------
Extracted Fields
--------------------------------
Merchant: Contoso
Address: 123 Main Street Redmond, WA 98052
Phone number: +9876543210
Date: 2019-06-10
Time: 13:59:00
Subtotal: 1098.99
Tax: 104.4
Total: 1203.39

znázornění výstupu Form Recognizeru | zdroj: azure.microsoft.com

Jak pracovat s Form Recognizerem

Form recognizer je složen ze tří služeb:

K vytrénování vlastního modelu je zapotřebí pouze pět ukázkových formulářů. Výsledkem takto vytrénovaného modelu jsou data strukturovaná podle informací vyčtených s daného formuláře. Váš model můžete dále trénovat a eventuálně jej použít ke spolehlivé extrakci dat.

Učení bez učitele

Standardně používá Form Recognizer učení bez učitele, kdy z vámi dodaných formulářů sám pochopí vztahy mezi jednotlivými položkami. Tato metoda je jednodušší na implementaci a nevyžaduje údržbu, proto je doporučeno vyzkoušet ji jako první.

Učení s učitelem

Neposkytuje-li formulář názvy parametrů (viz příklad účtenky výše), nebo je-li příliš složitý, můžeme použít Layout API a díky Form Recognizeru se učit pomocí námi zadaných značek. Takto naučený model pracuje spolehlivěji a přesněji.

Vytváření vlastního modelu pro Form Recognizer za použití Layout API
vytváření vlastního modelu za použití Layout API | zdroj: https://docs.microsoft.com

Využití v praxi

Využití Form Recognizeru v praxi je opravdu široké, své uplatnění tak najde nejen u čtení tištěných nebo psaných dokumentů, ale například také při validaci občanských průkazů či pasů. Možnosti jsou neomezené a implementace velmi jednoduchá, použít jej proto může opravdu každý.

Nastavení souborů Cookies

1. Co jsou soubory cookies

Soubory cookies jsou krátké textové soubory, které internetová stránka odešle do vašeho prohlížeče. Umožňují internetové stránce zaznamenat informace o vaší návštěvě, například zvolený jazyk a podobně. Následující návštěva stránek tak pro vás může být snazší a příjemnější. Soubory cookies jsou důležité, neboť bez nich by procházení sítě Internet bylo mnohem složitější. Soubory cookies umožňují lepší využití naší internetové stránky a přizpůsobení jejího obsahu vašim potřebám. Soubory cookies používá téměř každá internetová stránka na světě.

2. Druhy souborů cookies

Relační (tedy dočasné) soubory cookies nám umožňují propojovat vaše jednotlivé aktivity po dobu prohlížení těchto internetových stránek. V okamžiku otevření okna vašeho prohlížeče se tyto soubory vytvoří a po zavření okna vašeho prohlížeče se odstraní.

Trvalé soubory cookies nám pomáhají váš počítač identifikovat, jestliže opětovně navštívíte naši internetovou stránku.

3. Využívání souborů cookies

V souladu s ustanovením § 89 odst. 3 zák. č. 127/2005 Sb., o elektronických komunikacích, v účinném znění, si vás tímto dovolujeme informovat, že naše internetové stránky využívají pro svoji činnost soubory cookies, tedy vaše soubory cookies, včetně trvalých, zpracováváme.

Internetové prohlížeče obvykle obsahují správu souborů cookies. V rámci nastavení vašeho prohlížeče tak pravděpodobně můžete jednotlivé soubory cookies ručně mazat, blokovat či zcela zakázat jejich používání. Pro více informací použijte nápovědu vašeho internetového prohlížeče. Jsou-li cookies povoleny, lze toto nastavení internetového prohlížeče považovat za souhlas se zpracováním osobních údajů.

4. Účel použití souborů cookies

K personalizaci obsahu a reklam, poskytování funkcí sociálních médií a analýze naší návštěvnosti využíváme soubory cookies. Informace o tom, jak náš web používáte, sdílíme se svými partnery působícími v oblasti sociálních médií, inzerce a analýz. Používáním internetových stránek vyjadřujete souhlas propojením následujících služeb: Google Analytics, Google Tag Manager, Facebook Pixel, Microsoft Clarity.

Soubory cookies využíváme, kromě účelu uvedeného v předchozím odstavci, pouze pro měření návštěvnosti webové stránky.

5. Správce osobních údajů

Provozovatelem webové stránky studuj.digital a správcem osobních údajů je společnost: pg-sec s.r.o., sídlem Rybná 716/24, Staré Město, 110 00 Praha 1, identifikační číslo 09580905, zapsaná v obchodním rejstříku Městského soudu v Praze, oddíl C, vložka 338028.

​6. Zásady ochrany osobních údajů

Podrobnější informace o souborech cookies a zpracování tvých osobních údajů najdete v našich Zásadách ochrany osobních údajů.

Nezbytné

Tyto soubory cookie jsou nutné pro základní funkce stránky, a jsou proto vždy povolené. Mezi ně patří soubory cookie, které stránce umožňují si vás zapamatovat při procházení stránky v rámci jedné relace nebo, pokud o ně požádáte, mezi relacemi.

Volitelné

Výkon

Tyto soubory cookie nám pomáhají vylepšovat funkce stránek sledováním využití této webové stránky. V některých případech zrychlují zpracování vašeho požadavku a umožňují nám zapamatovat si vaše vybrané předvolby na stránce. Pokud soubory cookie zakážete, může se tím zhoršit přesnost našich doporučení a zpomalit funkčnost stránek.

Sociální média a relamy

Díky souborům cookies sociálních médií si můžete připojit ke svým sociálním sítím a prostřednictvím sociálních médií sdílet obsah z naší webové stránky. Reklamní soubory cookie (třetích stran) shromažďují informace pro lepší přizpůsobení reklamy tvým zájmům, a to na webových stránkách studuj.digital i mimo ně. V některých případech tyto soubory cookies zpracovávají vaše osobní údaje. Pokud chcete získat více informací o zpracování osobních údajů, přečtěte si naše Zásady ochrany osobních údajů. Pokud zakážete soubory cookies, mohou se zobrazovat reklamy, které méně souvisejí s vašimi zájmy, nebo nebudete moci účinně používat odkazy na Facebook, Instagram či jiné sociální sítě anebo nebudete moci sdílet obsah na sociálnch médiích.