Microsoft Azure Cognitive Services を活用し映像解析サービスを低価格で提供 ~顔認識や感情認識によってカメラ映像の活用領域を大きく広げる~


2015 年 11 月にベータ版がリリースされ、高度なデータ解析を身近な存在にした Azure Cognitive Services。これを活用し、映像解析サービスを月額 8,000 円からと、驚くべき低価格で提供しているのが、株式会社アロバ (以下、アロバ) です。同社の主力商品は、2008 年から連続 8 年国内 VMS (Video Management Software) 市場でトップ シェアを獲得し続けている、監視カメラ統合管理ソフトウェア「アロバビュー」。これに新たな付加価値を加えることで、映像データの利用領域を大幅に拡大しつつあります。今回はこのアロバの CTO である來田 泰樹 氏と、営業部マネージャーを務める吉田 将之 氏に、Azure Cognitive Services の活用に至った経緯や、実際に活用したうえでの印象、考えられる用途などについてお話を伺いました。

写真左より、株式会社アロバ 営業部 コンシューマービジネスチーム マネージャー 吉田 将之 氏、
株式会社アロバ 取締役 CTO 來田 泰樹 氏

 

監視カメラ市場は急成長続く有望市場
ここに特化するため 2015 年に分社化

 

―― まずは貴社の概要についてお教えください。

來田 株式会社アロバは、株式会社ルクレ (以下、ルクレ) から 2015 年に分社化した会社です。ルクレはもともと富士通株式会社の社内ベンチャーで、1995 年に株式会社トリワークス (以下、トリワークス) として設立、2011 年にルクレに社名変更しました。フォトアルバムや工事写真管理などの画像を扱うソフトウェアを開発していましたが、2003 年に監視カメラ事業に参入、2005 年に「アロバビュー」という監視カメラ統合管理ソフトウェアをリリースし、2008 年から 8 年連続で国内 VMS 市場シェア No.1 を維持しています。このアロバビューを軸とした事業に特化するため、設立されたのがアロバです。

 

―― 監視カメラ事業に特化する形で新会社を設立したのはなぜですか。

來田 東京オリンピックが開催される 2020 年に向けて、監視カメラ市場が急成長すると見込まれるからです。2003 年にトリワークスが監視カメラ事業に参入した時は、ちょうど IP カメラが登場したころなのですが、当社の社長は当時から「監視カメラの時代が来る」と語っていました。実際にその予測どおりになり、この市場は現在も年率 20% 程度の成長を続けています。現在はまだアナログ カメラも残っていますが、今後は IP カメラへのシフトがより進み、他システムとの連携があたり前になってくるでしょう。また画質も 4K (画素数がフル ハイビジョンの 4 倍の解像度) や 60 fps (frame per second、動画像を 1 秒間に書き換える回数、現在は 30 fps が一般的) が一般化するはずです。これにより監視目的だけではなく、映像ソースを取り込むデバイスとしても、重要な意味を持つようになります。

 

―― 非常に将来性の高い市場なのですね。

來田 そのとおりです。映像ソースのためのデバイスとして活用されるようになれば、用途は一気に拡大します。

 

アロバビュー最大の特長はカスタマイズ性の高さ
映像解析を行うサービスも 2016 年 8 月にリリース

 

―― その有望市場において、貴社ソリューションはどのような優位性をお持ちですか。

吉田 アピールしたい特長が 2 つあります。1 つは柔軟なカスタマイズが可能なことです。監視カメラは国内外で多様な製品が販売されていますが、ほとんどの VMS は特定のカメラだけに対応しており、多様なカメラと接続することができません。またカメラ画像の表示や録画だけしかできず、外部システムとの連携も困難です。これに対してアロバビューは、多様なカメラをサポートすると共に、外部システムとの連携や、機能追加などを簡単に行えるようになっています。お客様の要件に応じて、さまざまなシステムを構築できるのです。

 

―― もう 1 つの特長は。

吉田 映像解析を行う「アロバビューコーロ」というサービスを 2016 年 8 月から提供していることです。これは映像に含まれる人の顔を高い精度で認識し、異なるカメラに映った人物が同一人物であるか否かの照合を行なえます。また年齢や性別も把握でき、感情の定量化も可能です。

 

―― 2016 年 4 月には Microsoft BizSpark Plus の利用も始めていますね。

來田 アロバビューコーロの解析機能に、Microsoft Cognitive Services を活用しています。

 

―― Azure Cognitive Services に着目されたのは、いつごろですか。

來田 Microsoft Project Oxford (Azure Cognitive Services の前身) のころから興味を持っていました。実際に触れたのは 2015 年 12 月でしたが、これなら映像解析を短期間で実装できると思い、2016 年 3 月には実際にアロバビューと連携させたプロトタイプの開発に着手し、十分にいけるという手応えを感じました。

 

―― 2016 年 4 月の「Microsoft Innovation Award 2016」にもご応募いただき、ファイナリストに選出されましたね。Azure Cognitive Services をここまで使いこなせるのかと、目が覚めるような驚きを感じました。

來田 ありがとうございます。あそこでファイナリストになったことで、製品化への自信もつきました。製品化への具体的な検討を開始したのも、ちょうどこのころです。Azure を活用することで、提供価格を下げることも可能になりました。実はオンプレミス型の解析エンジンとの連携はこれまでも行っていたのですが、システム一式入れるのにユーザー様にとって数百万円の投資が必要になり、気軽には導入できないという問題を抱えていました。これに対してアロバビューコーロは、月額 8,000 円から利用できます。投資リスクやコストを抑えられるので、気軽に映像解析を始められるはずです。

 

精度の高い解析を高速に行える Azure Cognitive Services
BizSpark Plus が活用できることも大きな魅力

 

―― 実際に Azure Cognitive Services を使ってみて、どのような印象を持たれましたか。

photo04來田 まず Web 上で簡単にデモを行えるのがすばらしいと感じました。また顔照合の精度が高いのも魅力の 1 つです。さらに処理スピードも高速です。それまでは、クラウドで提供される機能はレスポンスが遅いというイメージを持っていたのですが、Azure Cognitive Services で完全に覆されました。提供されているベースの機能は静止画の解析なのですが、数 100 ミリ秒で結果が返ってくるので、動画にも十分対応できます。

 

―― アロバビューコーロのシステム構成は。

來田 まずデバイス接続用の PC に取り込んだ映像から顔部分を切り出し、インターネット経由で Microsoft Cognitive Services の Face API と Emotion API に渡し、年齢や性別、感情といった解析結果を受け取ります。この結果は映像表示に反映される一方で、Azure の Event Hubs に送られ、Stream Analytics でデータ集計および加工が行われます。さらに Power BI でグラフ化などの処理を行い、利用者端末で表示できるようになっています。

 

 

―― 開発期間は。

來田 Cognitive Services との連携部分は、3 月に開発に着手して 4 月 21 日の Innovation Award に間に合わせたので、だいたい 1 か月ですね。その後、5 月 24 日に開催された「de:code 2016」までに、Event Hubs 以降の部分との連携も実装しています。

 

―― かなり短い期間ですね。

來田 映像から顔部分を切り出すなど、これまで開発済みのベースがあったからです。また Cognitive Services も、画像データを API で渡すだけで使うことができるため、連携も簡単でした。

 

―― BizSpark Plus のメリットは。

來田 Azure を無償で使えるのは助かります。できるだけ多くのユーザーに使ってもらうためには比例してコストが増えますが、BizSpark Plus のおかげで当社の負担は最小限に抑えられています。

吉田 マイクロソフト主催のイベントで露出できるのも大きな魅力です。単独で露出するのは限界がありますが、マイクロソフトと一緒にやることで問い合わせも増えています。プロモーション面でも効果が大きいですね。

 

吉田 マイクロソフトのサポート担当者の熱意にも驚いています。何かあるとメールだけではなく、必ず電話でも対応してくれます。国内でのサポート事例が少ないStream Analytics でわからないことがあった時も、開発エンジニアに直接問い合わせた結果をすぐに調べて回答してくれました。他社のクラウド サービスでは「ネットを使って自分で調べてね」といったスタンスの所が多いので、このサポートの厚さにはびっくりしました。

 

店舗や展示会など、多様な領域での活用が可能
今後もスマート デバイス対応や機能拡張を進める

 

―― アロバビューコーロの用途としては、どのようなものが多いのでしょうか。

吉田 店舗や展示会での利用や、サイネージとの連携が多いですね。たとえば店舗でご利用いただければ、来店者の年齢や性別、リピーターか否か、接客によって笑顔になっているか、困った表情の来店者がいないかどうか、といったことが把握できます。またサイネージにカメラを設置して利用者の表情を解析すれば、どのようなコンテンツに興味を持つのか、性別/年齢別にわかります。展示会でご活用いただければ、来場者の数をかなりの精度で把握できます。一般の方が自由に入場できる展示会では、アンケートの回答枚数で来場者の数や属性を推測するのが一般的ですが、来場者 1 万人で 100 枚程度しかアンケートを回収できないケースが多く、十分な精度のデータが得られません。アロバビューコーロならカメラに映ったすべての人を、同一人物を二重カウントしないように数えることができ、年齢や性別といった外見からわかる属性も把握できるので、精度の高いデータを取得できます。

 

 

photo06_325
photo07_325

 

アロバビューは多彩な解析機能で、年齢、性別、表情などをリアルタイムで解析表示する。

 

―― 通行量調査にも使えそうですね。

吉田 そうですね。実際、店舗開発の方からは、店舗まわりの通行量を計測できないかというご相談もいただいています。通常であれば社員やアルバイト 4 ~ 5 人が 1 週間かけて行うので、かなりの人件費がかかりますが、アロバビューコーロならカメラの設置だけで無人で行えます。この他にも、コールセンターのコミュニケーターの笑顔判定に使いたいというニーズもあります。実際に笑顔かどうかは声にも現れ、これが顧客満足度を左右する要因になっているということです。

 

―― 今後の展開は。

來田 まずスマートフォンやタブレットのカメラに対応させていきます。既に開発は進んでおり、Android 版は年内にリリース予定です。iOS 版もデモが可能な状態になっており、来年の早い時期にリリースする計画です。

 

―― 9 月に行われた「Microsoft Foresight」でも、1 日目の基調講演の中で弊社の西脇 (日本マイクロソフト エバンジェリストの西脇 資哲) が、iPhone でアロバビューコーロのデモを披露していましたね。

來田 そうです。これもアロバビューの認知向上につながりました。それから Cognitive Services に関しては、Compute Vision API の活用も検討しています。これによって人間の顔以外の識別も可能になります。

吉田 たとえば最近では、青梅線が猪と衝突し、その影響で中央線が遅延しましたが、このような事象が発生した場合にカメラ画像を解析することで、何が起きたのかがすぐにわかります。アロバビューは公共交通機関への導入も多いので、「目としての機能」を強化していくことで、利便性がさらに高まると思います。

來田 IoT でもセンサー データだけではなく、映像を連携させていくことが今後重要になっていきます。このようなノウハウをさらに蓄積し、幅広いビジネスを展開していきたいと考えています。

 

―― カメラ映像と Cognitive Services と組み合わせには、さまざまな可能性があるのですね。本日はありがとうございました。

 

株式会社アロバ
株式会社ルクレからの分社により、2015 年に設立。主力製品の「アロバビュー」は、2008 年から国内 VMS (Video Management Software) 市場でトップ シェアを維持し続けています。2016 年 8 月には Microsoft Cognitive Services を活用した、月額 8,000 円から導入できる映像解析サービス「アロバビューコーロ」をリリース。ビデオ映像の可能性を広げ続けています。


Comments (0)

Skip to main content