Umělá inteligence – 3. díl

9. 5. 2020 Azure, Programming

V předchozím článku jsme se dozvěděli, co to je Machine Learning Studio, seznámili jsme se s prostředím a vytvořili si základní model experimentu. Služba Azure Machine Leraning Studio ale umí daleko více. Pojďme si projít nějaké další základy, abychom se stali odborníky na strojové učení.

K získání základních znalostí použijeme již připravené modely. Po nich vždy bude následovat procvičení práce a řešení cvičení. Tak pojďme na to!

Práce s UCI knihovnami

V této kapitole si ukážeme, jak implementovat data z webového serveru, přiřadit názvy jednotlivým sloupcům, přezkoumat data a vytvořit základní statistiky.

Výklad

Vytvoření experimentu

Spustíme si naše Microsoft Azure Machine Learning Studio (dále jen MLS), přihlásíme se a založíme nový experiment z šablon Microsoftu nesoucí název „Sample 1: Download dataset…

EXPERIMENTS -> NEW -> EXPERIMENT -> SAMPLE 1 -> OPEN IN STUDIO

Screenshot z Azure Machine Learning Studia s panelem výběru nového experimentu.
založme si nový experiment | zdroj: studio.azureml.net/

Nyní se nám otevřel již hotový experiment. Pojďme si projít jeho jednotlivé části…

Import Data

Tato položka nám importuje dataset z webové stránky ve formátu CSV.

Enter Data Manually

V této položce nastavujeme manuálně názvy jednotlivým sloupcům. Nesmíme zapomenout opět nastavit správný formát a jako první název přiřadit colum_name. To kvůli návaznosti v R / Python scriptu.

Execute R Script / Python Script

Položka s R Scriptem zajišťuje vytvoření názvů sloupců. Pojďme se podrobněji podívat na kód.

# Do následujících dvou proměnných nadefinujeme, ze kterých portů dostaneme data
dataset1 <- maml.mapInputPort(1) # class: data.frame
dataset2 <- maml.mapInputPort(2) # class: data.framea

# Přejmenujeme sloupce v datasetu 2 na ty, které jsme zadali v datasetu 1
colnames(dataset2) <- c(dataset1['column_name'])$column_name;
data.set = dataset2;

# Data pošleme na výstup
maml.mapOutputPort("data.set");
Screenshot z Azure Machine Learning Studia s R skriptem.
R skript s komentáři | zdroj: studio.azureml.net/

R Script můžeme také nahradit za Python Script. Kód bude pak vypadat následovně:

# Naimportujeme knihovnu pro práci s datasety
import pandas as pd

def azureml_main(dataframe1 = None, dataframe2 = None):
    # Přejmenujeme sloupce v datasetu 2 na ty, které jsme zadali v datasetu 1
    dataframe2.columns = dataframe1.column_name
    
    # Data pošleme na výstup
    return dataframe2, 
Screenshot z Azure Machine Learning Studia s Python skriptem.
Python skript s komentáři | zdroj: studio.azureml.net/

Summarize Data

Položka, která je schopna vytvořit základní statistiky o daných datech a zobrazit názvy sloupců v tabulce.

Práce s experimentem

Nyní již stačí experiment jednoduše spustit pomocí tlačítka RUN. Jakmile bude celý proces dokončený, stačí, abychom klikli pravým tlačítkem na položku Summarize Data > Result dataset > Visualise a můžeme si zobrazit základní statistiky a celkovou tabulku s názvy sloupců.

Screenshot z Azure Machine Learning Studia s výslednou interpretací dat.
výsledná interpretace dat | zdroj: studio.azureml.net/

Výsledná síť může vypadat třeba takto (POZN. stačí vám pouze jeden typ skriptu, vyberte si ten, který vám vyhovuje více):

Screenshot z Azure Machine Learning Studia s výslednou sítí.
kompletní síť | zdroj: studio.azureml.net/

Úkol na procvičení

Do nového experimentu naimportujte data z této adresy (http://mlr.cs.umass.edu/ml/machine-learning-databases/balance-scale/balance-scale.data). Vytvořte názvy sloupců a vytvořte jednoduchou analýzu dat.

Informace k datům naleznete zde: http://mlr.cs.umass.edu/ml/machine-learning-databases/balance-scale/balance-scale.names . Využijte k získání názvů jednotlivých sloupců.

Řešení úkolu

Řešení projektu naleznete v Azure AI Gallery na adrese: https://gallery.cortanaintelligence.com/Experiment/STC-Learn-Project-01

Závěr

Práce s daty v Azure není obtížná. Díky grafickému rozhraní se v MLS dokáže orientovat téměř každý. Pro vaše sebevzdělávání je výhodné využívat veřejných knihoven s velikým množstvím dat. Příkladem takové knihovny nám může být například https://data.world/uci nebo http://mlr.cs.umass.edu/ml/datasets.html.

Nastavení souborů Cookies

1. Co jsou soubory cookies

Soubory cookies jsou krátké textové soubory, které internetová stránka odešle do vašeho prohlížeče. Umožňují internetové stránce zaznamenat informace o vaší návštěvě, například zvolený jazyk a podobně. Následující návštěva stránek tak pro vás může být snazší a příjemnější. Soubory cookies jsou důležité, neboť bez nich by procházení sítě Internet bylo mnohem složitější. Soubory cookies umožňují lepší využití naší internetové stránky a přizpůsobení jejího obsahu vašim potřebám. Soubory cookies používá téměř každá internetová stránka na světě.

2. Druhy souborů cookies

Relační (tedy dočasné) soubory cookies nám umožňují propojovat vaše jednotlivé aktivity po dobu prohlížení těchto internetových stránek. V okamžiku otevření okna vašeho prohlížeče se tyto soubory vytvoří a po zavření okna vašeho prohlížeče se odstraní.

Trvalé soubory cookies nám pomáhají váš počítač identifikovat, jestliže opětovně navštívíte naši internetovou stránku.

3. Využívání souborů cookies

V souladu s ustanovením § 89 odst. 3 zák. č. 127/2005 Sb., o elektronických komunikacích, v účinném znění, si vás tímto dovolujeme informovat, že naše internetové stránky využívají pro svoji činnost soubory cookies, tedy vaše soubory cookies, včetně trvalých, zpracováváme.

Internetové prohlížeče obvykle obsahují správu souborů cookies. V rámci nastavení vašeho prohlížeče tak pravděpodobně můžete jednotlivé soubory cookies ručně mazat, blokovat či zcela zakázat jejich používání. Pro více informací použijte nápovědu vašeho internetového prohlížeče. Jsou-li cookies povoleny, lze toto nastavení internetového prohlížeče považovat za souhlas se zpracováním osobních údajů.

4. Účel použití souborů cookies

K personalizaci obsahu a reklam, poskytování funkcí sociálních médií a analýze naší návštěvnosti využíváme soubory cookies. Informace o tom, jak náš web používáte, sdílíme se svými partnery působícími v oblasti sociálních médií, inzerce a analýz. Používáním internetových stránek vyjadřujete souhlas propojením následujících služeb: Google Analytics, Google Tag Manager, Facebook Pixel, Microsoft Clarity.

Soubory cookies využíváme, kromě účelu uvedeného v předchozím odstavci, pouze pro měření návštěvnosti webové stránky.

5. Správce osobních údajů

Provozovatelem webové stránky studuj.digital a správcem osobních údajů je společnost: pg-sec s.r.o., sídlem Rybná 716/24, Staré Město, 110 00 Praha 1, identifikační číslo 09580905, zapsaná v obchodním rejstříku Městského soudu v Praze, oddíl C, vložka 338028.

​6. Zásady ochrany osobních údajů

Podrobnější informace o souborech cookies a zpracování tvých osobních údajů najdete v našich Zásadách ochrany osobních údajů.

Nezbytné

Tyto soubory cookie jsou nutné pro základní funkce stránky, a jsou proto vždy povolené. Mezi ně patří soubory cookie, které stránce umožňují si vás zapamatovat při procházení stránky v rámci jedné relace nebo, pokud o ně požádáte, mezi relacemi.

Volitelné

Výkon

Tyto soubory cookie nám pomáhají vylepšovat funkce stránek sledováním využití této webové stránky. V některých případech zrychlují zpracování vašeho požadavku a umožňují nám zapamatovat si vaše vybrané předvolby na stránce. Pokud soubory cookie zakážete, může se tím zhoršit přesnost našich doporučení a zpomalit funkčnost stránek.

Sociální média a relamy

Díky souborům cookies sociálních médií si můžete připojit ke svým sociálním sítím a prostřednictvím sociálních médií sdílet obsah z naší webové stránky. Reklamní soubory cookie (třetích stran) shromažďují informace pro lepší přizpůsobení reklamy tvým zájmům, a to na webových stránkách studuj.digital i mimo ně. V některých případech tyto soubory cookies zpracovávají vaše osobní údaje. Pokud chcete získat více informací o zpracování osobních údajů, přečtěte si naše Zásady ochrany osobních údajů. Pokud zakážete soubory cookies, mohou se zobrazovat reklamy, které méně souvisejí s vašimi zájmy, nebo nebudete moci účinně používat odkazy na Facebook, Instagram či jiné sociální sítě anebo nebudete moci sdílet obsah na sociálnch médiích.