Oslík nebo ovečka? Trénování Microsoft Custom Vision AI modelu

Kognitivní služby v Azure mají připravené vision modely, které jsou schopné říct, zda je na obrázku ovce nebo osel (pro strojové vyhodnocování živého betléma se vám to příští týden může hodit). Ale co ty plyšové? Ty samozřejmě nepozná. O strojovém učení nevím skoro nic, ale služba Custom Vision vypadá tak jednoduše, že bych ji mohl zvládnout a vy určitě také. Pojďme natrénovat model, který na obrázku označí kde je oslík a kde ovečka.

Pojďme na stránku https://www.customvision.ai/

Po přihlášení budete mít trialku, ale já mám svůj Azure a chci si zaplatit těch doslova pár korun za plnou verzi. Mohl bych samozřejmě účet vytvořit v Azure, ale přímo z této stránky se to dá udělat taky.

V Azure se nám vyvořily příslušné zdroje.

Vytvořme si tedy nový projekt.

Můžeme provádět klasifikaci obrázků, ale já bych chtěl raději detekci objektů. Ať mi hračky počítač nejen pozná, ale i řekne kde v obrázku jsou.

Nejdřív musíme trénovat a tak jsem si vyfotil oba plyšáky z různých úhlů, s různým pozadím, v jiných polohách a světelných podmínkách. Jen tak na zkoušku mám asi kolem 25 fotek, ale na přesnějších model by jich to chtělo víc. Nahraji je do Custom Vision.

Teď potřebuji robotovi říct, kde je jaký objekt, tedy ovečka a oslík.

Tohle uděláme pro všechny obrázky a jdeme natrénovat model.

Máme hotovo.

Teď už můžeme rovnou přistupovat na API a začlenit vyhledávání oslíka a ovečky do vlastní aplikace.

Pojďme si ale přímo z GUI vyzkoušet, jak nám to funguje. Mám dvě fotky, které robot ještě neviděl, tak pojďme na to.

Funguje krásně!

 

A teď něco složitějšího. Pozadí s rušivými obrázky, plyšáci v zákrytu…
… více na blogu autora https://tomaskubica.cz

(Autorem článku je Tomáš Kubica, Microsoft Azure TSP.)