Rozpoznávání ručně nebo elektronicky vyplněných dokumentů a formulářů nikdy nebylo snazší! Azure Form Recognizer je jedna z nejnovějších služeb Azure Cognitive Services. Nejedná se ale pouze o rozpoznávání textu, Form Recognizer jde ještě dále – textu dokonce přiřadí význam!
Obsah
Co je to
Form Recognizer umožňuje jednoduše z digitálních dokumentů extrahovat text v podobě key-value pair (formát uspořádané dvojice <název parametru, hodnota>), tabulky nebo prostého textu. Největší výhodou Form Recognizeru je, že vyžaduje minimální množství dat k pochopení formuláře a podává rychlé, přesné a konzistentní výsledky. Data, která takto získáte, jsou šité na míru vašemu obsahu a to vše jednoduše, bez znalostí umělé inteligence. Form Recognizer využívá pro své volání REST API, proto je možné jej použít v široké řadě zařízení a aplikací.
Key-Value pair – data ve formátu uspořádané dvojice klíče a hodnoty <název parametru, hodnota>, např. „Address“, „123 Main Street Redmond, WA 98052“.
OCR – Optické rozpoznávání znaků – metoda, která umožňuje překlad tištěného nebo psaného textu do textu, s nímž lze pracovat jako s normálním počítačovým textem.
--------------------------------
Extracted Fields
--------------------------------
Merchant: Contoso
Address: 123 Main Street Redmond, WA 98052
Phone number: +9876543210
Date: 2019-06-10
Time: 13:59:00
Subtotal: 1098.99
Tax: 104.4
Total: 1203.39
znázornění výstupu Form Recognizeru | zdroj: azure.microsoft.com
Jak pracovat s Form Recognizerem
Form recognizer je složen ze tří služeb:
- Custom models (vlastní modely) – Extrakce dat z vlastních formulářů. Model si trénujete sami, je tak šitý na míru vašim potřebám.
- Předpřipravený model účtenky (viz ukázka nahoře)
- Layout API – umožňuje učení s učitelem pomocí značek
K vytrénování vlastního modelu je zapotřebí pouze pět ukázkových formulářů. Výsledkem takto vytrénovaného modelu jsou data strukturovaná podle informací vyčtených s daného formuláře. Váš model můžete dále trénovat a eventuálně jej použít ke spolehlivé extrakci dat.
Učení bez učitele
Standardně používá Form Recognizer učení bez učitele, kdy z vámi dodaných formulářů sám pochopí vztahy mezi jednotlivými položkami. Tato metoda je jednodušší na implementaci a nevyžaduje údržbu, proto je doporučeno vyzkoušet ji jako první.
Učení s učitelem
Neposkytuje-li formulář názvy parametrů (viz příklad účtenky výše), nebo je-li příliš složitý, můžeme použít Layout API a díky Form Recognizeru se učit pomocí námi zadaných značek. Takto naučený model pracuje spolehlivěji a přesněji.
Využití v praxi
Využití Form Recognizeru v praxi je opravdu široké, své uplatnění tak najde nejen u čtení tištěných nebo psaných dokumentů, ale například také při validaci občanských průkazů či pasů. Možnosti jsou neomezené a implementace velmi jednoduchá, použít jej proto může opravdu každý.