株式会社アジラ | Activate all streams !!

行動認識AIに特化した映像解析事業で、犯罪や事故を未然に防ぐ世界を目指す株式会社アジラの公式ウェブサイトです。

今後需要が拡大する視覚野の代替「行動認識AI」と、そのビジネス活用事例をご紹介

行動認識技術とは

画像、映像、加速度、磁気、その他センサーによって、ターゲットの情報収集および測定を行い、データマイニング、機械学習(深層学習含む)、パターン認識などのさまざまなテクノロジーを使用して、人物の行動特徴を抽出することで、対象者の姿勢、立っている、歩いている、走っている、ジャンプしているなど、さまざまな静的・動的なステータスを抽出します。

現在、人物の行動認識には、主に頭の動きの認識、ジェスチャーの認識、歩行の認識、異常な姿勢の認識、手先の認識などが含まれています。また、手法はいくつかあり、映像入力をベースとし、コンピュータービジョンに基づく行動認識は「行動認識AI」と呼ばれています。

今回のコラムではアジラの「行動認識AI」の仕組みや、ビジネス活用方法についてご紹介したいと思います。

アジラの行動認識AI "Asilla Behavior Recognition" とは

アジラの行動認識AI、"Asilla Behavior Recognition" は、センサーなどを利用せずに、防犯カメラの画角映像に映った人物の行動を認識・推論結果が出力可能な、商用利用を目的に開発された複合的なAIシステムです。

f:id:asilla:20220417134803p:plain

上図のように、映像情報(rtsp, mp4など)を入力情報とし、姿勢推定と時系列分析で人物行動を推定し、推論結果を出力します。この仕組みを商用利用で実現するためには、以下①~④の4つの技術をバランスよく組み合わせる必要がありました。複数のAIの推論結果を相互にやりとりすることから、結束されたAI「Bound-AI」と呼称しています。

f:id:asilla:20220417180756j:plain

アジラの「行動認識AI」は"バウンデッドAI"
①姿勢推定技術(Pose Estimation)

センサーを用いず、映像や画像を入力として、人物の関節座標を検出することで人物の全身を把握し、リアルタイムに複数人の姿勢を推定するAI技術です。有名なオープンソースとしてカーネギーメロン大学の「OpenPose」があり、ディープラーニングの黎明期から展示会等で目に触れることの多い技術ですが、アジラの姿勢推定技術 AsillaPose® は、以下の開発コンセプトにより自社でゼロから開発されており、似て非なるものと言えます。

  • 一枚の画像に対する姿勢推定だけではビジネス価値はない
  • 映像を「時系列」解析処理することでビジネス価値を創出
  • 時系列処理においてロバストかつ高精度・高速処理を併せ持つことが必要不可欠

つまり、アジラ社のAsillaPose®は時系列解析のために最適化された姿勢推定技術と言えます。

メトリクスはmAP, fpsを元指標にしたパフォーマンススコアを採用しており、現在、単純比較ではOpenPoseの2.1倍の性能(COCO)で、2016年から2025まで年率26.8%の性能向上を継続できる見通しです。ここ数年コンペティターとしてカナダのAIスタートアップをベンチマークしていましたが、最近某米国ヘルスケア企業に買収されました。

②人物トラッキング技術(Human Tracking)

前述の姿勢推定の推論結果を時系列処理するために必要不可欠なのが、人物トラッキング技術です。各人物に発行したIDが遮蔽や交差で混乱してしまう場合、時系列処理が破綻してしまうため、「行動認識AI」の実現にはロバストなトラッキング技術が必要とされます。アジラ社のトラッキング技術、開発コード"TT"は、AsillaPose®にインテグレートされており、ロバストかつ高い追随性を提供することが可能です。

ちなみに"TT"は Thai Tracking でAsilla Vietnam CTOの名が冠されています。

f:id:asilla:20220417134758p:plain

ロバストな人物トラッキング技術が必要不可欠

メトリクスはMOTAを採用しており、前述のコンペティターの5倍の性能を発揮することが可能です。

③行動推定技術(Behavor Recognition)

姿勢推定AI、AsillaPose®から出力される姿勢情報及びID情報を総合して、個別の行動とのベクトルマッチングで特定の行動を検知したり、異常検知モデルで異常行動を検知するAIモデルです。①と②の性能に依存し、メトリクスはF1 Scoreを用います。

f:id:asilla:20220417152331p:plain

ベースのAIアルゴリズムは、Auto Encoder, One-Class Classification, LSTM, Graph Convolutional Networksなどが活用されています。

④AIモデル圧縮技術(Quantization, Distillation)

前述の①②③の消費する計算リソースをミニマライズする技術です。アジラでは①②③の処理を一台のサーバで、60~80ストリーム(=カメラ台数)をリアルタイム処理できるコストパフォーマンスを発揮しており、その源泉はこのモデル圧縮技術にあります。

メトリクスはそれぞれのAIモデルで活用されているmAP, fps ,MOTA, F1であり、基本的なモデリング思想は「極力精度を保持しつつfpsを高める」というものになります。様々な手法があるなかで、特にアジラ社が優れているのは、知識の蒸留(Knowledge Distillation)手法で、ビジネスに最適なメトリクスのバランスを調整する事が可能です。

ビジネス活用事例

アジラの「行動認識AI」は、防犯セキュリティやスマートシティ分野において大手企業9社、モビリティ分野で同3社、製造業で同2社、ヘルスケア・介護分野で1社にて、現在も利活用されています(2022年3月末時点)。

各社とも当該技術を非常に高く評価しており、PMFのためのAIソリューション開発プロジェクトのQCD及びビジネス価値の評価は 4.6pt / 5.0pt満点と高く、今後のビジネススケールが期待されます。

最後に本技術を使ったビジネス活用事例についてご紹介いたします(公開可能なものに限定されてしまうのが残念ですが)。

①施設向けAI警備システム

現在、日本の治安が「悪化した」と体感している国民が過半数を超える中、警備業界の人手不足は深刻な状況(事業者の約9割が人手不足)で、これらのギャップは日増しに大きくなり、施設警備の品質は低下の一途を辿っています。この状況に対し、不動産オーナー様、施設運営事業者様、社会インフラの皆さまの危機感は日に日に高まってきてます。

これに対しアジラは「施設向けAI警備システム」を市場に展開しています。このシステムは、既に設置されているカメラシステムをAI化することができ、施設利用者の異常行動や不審行動を瞬時に検知・判定することで、犯罪の未然防止や、緊急・救急要請の迅速化につなげていくことができるプロダクトです。

アジラは「行動認識AI」を施設向けに社会実装し、事件事故の未然防止を実現しています。自社オリジナルのプロダクトとして開発、販売しているので、お気軽にお声がけください。

違和感行動の検知

転倒の検知

ケンカや酔っぱらいの検知

ビデオ管理システムに通知

 

②オレオレ詐欺(特殊詐欺)を防ぐ

特殊詐欺による被害総額は 年間285億円。ATM振り込み時の特定行動や属性の推定で水際対策を実施します。ATM内臓のカメラでも、店舗に設置の防犯カメラでも可能です。

アジラは元刑事の製品開発アドバイザー、齋藤顕氏(元警察庁⻑官官房)から得られる知見やノウハウをAIに反映させており、特殊詐欺にあって振込を行う高齢者のほか、キャッシュカードを預かって出金を行う「出し子」と呼ばれる犯罪予備軍の検知も可能です。

こちらはフィジビリティスタディの段階で、POCスタートとなります。課題をお持ちの皆さま、ぜひお声がけください。

 

 

③遊技台での不正行為を防ぐ

パチンコやスロットの遊技台での不正行為による被害総額は6年半で280億円。遊技台での不自然な手の動き(コインやカード投入以外)、キョロキョロする仕草などの不審な行動を検知→アラートし、店内を複数カメラをまたいで継続的にトラッキングすることが可能です。こちらもフィジビリティスタディの段階で、POCスタートとなります。課題をお持ちの皆さま、ぜひお声がけください。

 

④製造業向けソリューション

生産ラインにおける手順ミスのアラートや丁重的な作業分析によって、品質レベル向上や作業効率化に「行動認識AI」が活用されています。こちらはフィジビリティスタディーが完了しており、共同製品開発及び販売パートナーを探しております。

食品生産ラインや製薬含む製造業にチャネルをお持ちでご興味のある企業様のお声がけをお待ちしております。オートメーションすることのできない熟練工のワザが、高齢化によって継承不可能なリスクにある中、ぜひこの企画をプロダクト化し、日本中の中小製造業を支えていければ幸いです。

 

 

さいごに

昨今、人工知能(AI)による「ヒトの視覚野の代替」システムの社会実装は着々と進んでいるようにも見えますが、一方で「PoC止まり」など、実際はあまりビジネス価値が創出できていないという見解もあります。

その理由は、一枚の画像の認識に留まっているからではないか、と私たちは考えています。世の中にローンチされている視覚野の代替価値を標榜するAI製品は、単一の画像をCNN等で認識するものがほとんどです。

一方、アジラは創業期からヒトの視覚野の代替は、ヒトの視覚野系の処理と同様に、映像を時系列で解析してこそ実現可能であるとし、高い技術目標に向かって日々技術を研鑽してまいりました。

目標が高すぎて「行動認識AI」を商用ラインに乗せるまで7年、プロダクトを発表するまでに8年もの歳月を要してしまいました。ですが、初志を貫き通した甲斐があり、多くの皆さまに高く評価して頂けるテクノロジーが世に出せたと実感しています。

ぜひアジラの「行動認識AI」を、「施設向けAI警備システム」をご活用頂き、皆さまの市場におけるビジネス価値を向上して頂ければ幸いです。