Form Recognizer – úvod

29. 4. 2020 Azure, Programming

Rozpoznávání ručně nebo elektronicky vyplněných dokumentů a formulářů nikdy nebylo snazší! Azure Form Recognizer je jedna z nejnovějších služeb Azure Cognitive Services. Nejedná se ale pouze o rozpoznávání textu, Form Recognizer jde ještě dále – textu dokonce přiřadí význam!

Co je to

Form Recognizer umožňuje jednoduše z digitálních dokumentů extrahovat text v podobě key-value pair (formát uspořádané dvojice <název parametru, hodnota>), tabulky nebo prostého textu. Největší výhodou Form Recognizeru je, že vyžaduje minimální množství dat k pochopení formuláře a podává rychlé, přesné a konzistentní výsledky. Data, která takto získáte, jsou šité na míru vašemu obsahu a to vše jednoduše, bez znalostí umělé inteligence. Form Recognizer využívá pro své volání REST API, proto je možné jej použít v široké řadě zařízení a aplikací.

Key-Value pair – data ve formátu uspořádané dvojice klíče a hodnoty <název parametru, hodnota>, např. „Address“, „123 Main Street Redmond, WA 98052“.

OCROptické rozpoznávání znaků – metoda, která umožňuje překlad tištěného nebo psaného textu do textu, s nímž lze pracovat jako s normálním počítačovým textem.

Fotografie účtenky

--------------------------------
Extracted Fields
--------------------------------
Merchant: Contoso
Address: 123 Main Street Redmond, WA 98052
Phone number: +9876543210
Date: 2019-06-10
Time: 13:59:00
Subtotal: 1098.99
Tax: 104.4
Total: 1203.39

znázornění výstupu Form Recognizeru | zdroj: azure.microsoft.com

Jak pracovat s Form Recognizerem

Form recognizer je složen ze tří služeb:

K vytrénování vlastního modelu je zapotřebí pouze pět ukázkových formulářů. Výsledkem takto vytrénovaného modelu jsou data strukturovaná podle informací vyčtených s daného formuláře. Váš model můžete dále trénovat a eventuálně jej použít ke spolehlivé extrakci dat.

Učení bez učitele

Standardně používá Form Recognizer učení bez učitele, kdy z vámi dodaných formulářů sám pochopí vztahy mezi jednotlivými položkami. Tato metoda je jednodušší na implementaci a nevyžaduje údržbu, proto je doporučeno vyzkoušet ji jako první.

Učení s učitelem

Neposkytuje-li formulář názvy parametrů (viz příklad účtenky výše), nebo je-li příliš složitý, můžeme použít Layout API a díky Form Recognizeru se učit pomocí námi zadaných značek. Takto naučený model pracuje spolehlivěji a přesněji.

Vytváření vlastního modelu pro Form Recognizer za použití Layout API
vytváření vlastního modelu za použití Layout API | zdroj: https://docs.microsoft.com

Využití v praxi

Využití Form Recognizeru v praxi je opravdu široké, své uplatnění tak najde nejen u čtení tištěných nebo psaných dokumentů, ale například také při validaci občanských průkazů či pasů. Možnosti jsou neomezené a implementace velmi jednoduchá, použít jej proto může opravdu každý.