Cognitive Services の Text Analytics API 日本語対応強化

Text Analytics API、日本語対応機能強化

Cognitive Services の Text Analytics API の対応言語が拡大、日本語で利用できる機能が増えました。

from Cortana Intelligence and Machine Learning Blog > Text Analytics API Now Available in Multiple Languages

Text Analytics API は文章解析を行う API で、文章の言語判定、キーフレーズやトピックの抽出、ネガポジ (Sentiment) 分析などを行うことができます。

Microsoft Cognitive Services > Text Analytics API

今回の機能拡大により、日本語文章のキーフレーズ抽出ができるようになりました。こちら Text Analytics API のデモサイト↓で簡単に試すことができます。

https://text-analytics-demo.azurewebsites.net/

文章を入力して [Analyze!] をクリックすると、分析結果が表示されます。黄色に表示されるのが抽出されたキーフレーズです。

bluesky_20160623_01

Text Analytics API の使い方

言語判定、キーフレーズ抽出、ネガポジ分析はそれぞれ Request URL が異なります。

 //言語判定
POST https://westus.api.cognitive.microsoft.com/text/analytics/v2.0/languages
//キーフレーズ抽出
POST https://westus.api.cognitive.microsoft.com/text/analytics/v2.0/keyPhrases
//ネガポジ分析
POST https://westus.api.cognitive.microsoft.com/text/analytics/v2.0/sentiment

 

言語判定

まず最初に言語判定を行います。複数のセンテンスを一度に送信できます (→ idで判別)。

 POST https://westus.api.cognitive.microsoft.com/text/analytics/v2.0/languages HTTP/1.1
Content-Type: application/json
Host: westus.api.cognitive.microsoft.com
Ocp-Apim-Subscription-Key: ••••••••••••••••••••••••••••••••

{
  "documents": [
    {
      "id": "1",
      "text": "今日の天気は雨のち晴れです。"
    }
  ]
}

判別された言語と確度スコアが 0~1(→0~100%) で表示されます。

 Transfer-Encoding: chunked
x-aml-ta-request-id: ••••••••••••••••••••••••••••••••
X-Content-Type-Options: nosniff
Date: Thu, 23 Jun 2016 ••:••:•• GMT
Content-Type: application/json; charset=utf-8

{
  "documents": [
    {
      "id": "1",
      "detectedLanguages": [
        {
          "name": "Japanese",
          "iso6391Name": "ja",
          "score": 1.0
        }
      ]
    }
  ],
  "errors": []
}

 

キーフレーズ抽出

キーフレーズ抽出では、パラメーターとして言語を指定する必要があります。

 POST https://westus.api.cognitive.microsoft.com/text/analytics/v2.0/keyPhrases HTTP/1.1
Content-Type: application/json
Host: westus.api.cognitive.microsoft.com
Ocp-Apim-Subscription-Key: ••••••••••••••••••••••••••••••••

{
  "documents": [
    {
      "language": "ja",
      "id": "1",
      "text": "今日の天気は雨のち晴れです。"
    }
  ]
}

抽出されたキーフレーズが返されます。

 Transfer-Encoding: chunked
x-aml-ta-request-id: ••••••••••••••••••••••••••••••••
X-Content-Type-Options: nosniff
Date: Thu, 23 Jun 2016 ••:••:•• GMT
Content-Type: application/json; charset=utf-8

{
  "documents": [
    {
      "keyPhrases": [
        "天気",
        "晴れ"
      ],
      "id": "1"
    }
  ],
  "errors": []
}

 

Cognitive Service API Reference

以上のような API のテストは、Cognitive Services API Reference (Text Analytics) が便利です。Request parameter, header, body を生成でき、そのまま Send したときの Response を画面上で確認できます。

bluesky_20160623_02