Computer Vision API よくあるご質問

Computer Vision API について、現在までいただいたお問い合わせの中から、今月時点でご案内可能な内容をご紹介いたします。同様の疑問をお持ちの方に、お役に立てば幸いです。

 

Q1. Computer Vision API を使用した業務システムを作成しようとしています。システムの規模感としては、Computer Vision APIのFreeプランで問題ないのですが、業務用システムに Free プランで使用してもルール上問題はないでしょうか。

 

A1. はい、問題ありませんが、通常業務利用で必要となる可用性を担保する必要がある場合にはStandard プランのご利用をご検討ください。

 

Free のプランについて特に業務利用を制限するような規定は設けられておりません。

 

しかしながら Free のプランは一般に各サービスの機能をお試しいただくためにご用意しており、通常業務利用で必要となる可用性に関する SLA が Free プランでは保証されておりません。

 

そのため、作成される業務システムで可用性を担保する必要がある場合には Standard プランのご利用をご検討ください。

 

- Cognitive Services の価格 - Computer Vision API

<https://azure.microsoft.com/ja-jp/pricing/details/cognitive-services/computer-vision/ >

抜粋:

-------------------------

サポートおよび SLA

- 請求およびサブスクリプション管理サポート(無償) が含まれます。

- Cognitive Services については、Standard レベルでの実行時に99.9% の可用性が保証されます。Free レベルに対して、SLA は提供されません。SLA を参照してください。

-------------------------

 

- Cognitive Services の SLA

<https://azure.microsoft.com/ja-jp/support/legal/sla/cognitive-services/v1_1/ >

抜粋:

-------------------------

マイクロソフトは、Cognitive Services が99.9% の時間において利用可能であることを保証します。Free レベルについては SLA は提供されません。

-------------------------

 

 

Q2. Computer Vision API の OCR に日本語を含む画像を入力すると、出力される JSON の結果が、単語としてではなく、一文字ずつの text として扱われます。例えば、以下のように「管理者向け」という文字を記載した画像 (PNG) ファイルを作り、以下の URL の「画像内のテキストの読み取り」に与えると、以下のような JSON になります。これは想定された動作ですか?

 

Computer Vision API

 https://azure.microsoft.com/ja-jp/services/cognitive-services/computer-vision/

 

clip_image002

 

clip_image004

 

A2. はい、現時点では想定された動作です。

 

日本語の単語を扱いたい場合は、この動作を前提に、ご自身でJSONをパースしてつなげるなど、方法を模索していただく必要があります。

例えば、検出した文字はJSON レスポンス内のlines, words, boundingBox の値から特定の領域内にある文字列であるということは判定できます。

clip_image005

レスポンス内の各値については、Get Handwritten Text Operation Result をご参照ください。

 

 

Q3. Computer Vision API の使用料金は、トランザクションあたりの料金設定になっていると思いますが、トランザクションはどのようにカウントすればよいのでしょうか?

 

A3. Computer Vision API の料金サイトに記載がございますトランザクションとは 1 回の API 呼び出しに該当しています。つまり 1 トランザクション= 1 回の API 呼び出しです。

 

API 呼び出しとは下記資料のComputer Vision API の呼び出しになります。何れかの API を一度呼び出しますと 1 トランザクションとカウントされます。

 

Computer Vision API - v1.0

https://westus.dev.cognitive.microsoft.com/docs/services/56f91f2d778daf23d8ec6739/operations/56f91f2e778daf14a499e1fa

 

以下のように Azure Portal 上の、TOTAL CALLS からコール数を確認できます。

 

clip_image007

 

 

Q4. Computer Vision API に画像を数百個入力し、結果をCSV 出力した結果、いくつかのレコードに「Rate limit is exceeded. Try again in 9 seconds.」が入っており、通常の分析結果が入っていませんでした。対処方法を教えて下さい。

 

A4. ご報告いただきました現象は、レコードの記載の通り、無料試用版の制限に該当しております。

 

そのため、表示されております時間、下記メッセージであれば 9  秒後に改めて API を実行してください。

 

 「Rate limit is exceeded. Try again in 9 seconds.」

 

また、無料試用版につきましては、1 分間に 20 回の API 呼び出しが上限として設定されておりますため、呼び出し頻度を調整いただくことでも対処できます。

 

他の選択肢として、S1 以上でのご契約を利用いただくことでも対処可能ですが有料となりますことをご留意ください。

 

Cognitive Services の価格 - Computer Vision API

https://azure.microsoft.com/ja-jp/pricing/details/cognitive-services/computer-vision/

 

 

Q5. Computer Vision API の Analyze を、details に Landmarks をセットして、ある建物の画像の URL を入力しましたが、その建物の情報が返ってきません。

 

A5. Computer Vision API は画像内に建物の全体像が入っていないと Landmark として認識することができません。例えば、屋根の部分が含まれていないと、認識されません。

 

建物全体の画像を用意して対応していただくことは可能かご検討ください。

 

 

上記がお役に立てば幸いです。

 

Cognitive Services 開発サポートチーム 津田