Cognitive Services: 写真を用意するだけ!Custom Vision でカスタム画像認識エンジン作成

[English Version available]

Custom Vision : Microsoft Cognitive Services

Custom Vision は Cognitive Services に追加されたサービスで、ご自分で用意した画像を使ってカスタムの画像認識エンジンを作成、Web API から呼び出せるサービスです。ご自分で画像認識ロジックを構築することなしに、画像をアップロードしてタグ付けし、学習させることで画像認識エンジンを構成できます。

 

Custom Vision を利用したカスタム写真認識エンジンの作成方法

準備

  • Microsoft アカウント
  • 画像 (写真)
    • [学習用データ]ひとつのタグにつき、5枚以上の写真が必要です。
      [テスト用データ] とりあえず2-3枚ご用意ください。
      → 下記で使ったものと同じ画像をダウンロード可能です :)
    • 画像は jpg/png/bmp、1枚当たり 4MB 未満

 

手順

Custom Vision Portal からの写真アップロード &認識エンジンの 学習 画像認識エンジンのテスト

より詳細な手順は 人工知能パーツ Microsoft Cognitive Services で食べ物画像判定 BOT を作ろう! [Custom Vision API 設定編] をご覧ください。

Custom Vision Portal からの写真アップロード & 認識エンジンの学習

Custom Vision のポータル (https://customvision.ai/) から、写真のアップロードやタグ付け、学習などを行います。Microsoft アカウントでサインインします。

 

[+New Project] をクリックして新規プロジェクトを作成します

Name (プロジェクト名) と Description (プロジェクトの説明) を入力し、Domain (ドメイン、画像のカテゴリ) を選択します。今回は食べ物判定を行うエンジンを作成するので、Food を選択します。

作成したプロジェクトをクリックして、Workspace ページから写真のアップロードとタグ付けを行います。

ローカル環境から選択して画像をアップロードします。同じタグをつける写真は一度にアップロードできます。食べ物だと判定する food というタグとここでは sushi というタグを設定します。

同様に Add images をクリックして、写真とタグを追加します。今回は  food (全部の写真に適用), curry, gyoza, pizza, ramen, sushi というタグを作成しました。この写真を使って画像認識エンジンを学習させるには、画面上部にある  [Train] をクリックします。

 

画像認識エンジンをテスト

学習が終了すると、Prediction URL というリンクが表示されます. 先に [Quick Test] から画像認識エンジンをテストします。

ローカル環境から選択、またはオンライン(パブリックストレージ) 画像の URL を入力します。(学習データで利用していない画像でテストを行ってください。)  認識されたタグと信頼度 (Probability) が表示されます。

[Prediction URL] をクリックすると、API からのアクセスに必要な情報が表示されます。

この情報を使って API 経由でアクセスすることが可能です。

Prediction URL の画面で表示された URL に、Content-type および Prediction-key を header にセット、Body に URL をバインドして、POST します。Quick Test と同様に、JSON の Prediction 部分に判定されたタグ (Tag) と信頼度 (Probability) が表示されます。