アジラプレス ~「優しいAI」で人々を豊かに~

『やさしいAI』でおなじみ株式会社アジラのPR

非定型ソリューション用フレームワーク【freeFormer】を解説します


 アジラでは、AI-OCRジジラサービスの一環として、特殊性が高いうえにフォーマットが一定しない帳票のOCR処理を可能にするため、【freeFormer】なるフレームワークをベースにソリューション開発を進めています。(プレスリリース

freeFormerフレームワーク


 本稿ではfreeFormerを開発した経緯とその適用領域、構成、実際の案件の進め方などを簡単に説明させていただきます。

 

◆新世代OCR=非定型OCR

 世の中には様々な種類の帳票が存在しており、OCRはそれら全てを効率よく読み取ることが要求されます。
 しかし、特定の帳票種は、「その帳票から取得したい情報は一定なのに、フォーマットは様々」というものもあり、従来の定型OCRのようにフォーマット一つ一つ読み取り場所を定義していては、効率が悪すぎてOCR導入の意味がなくなってしまうというジレンマが生じていました。
 例えば、毎月取引先から届く注文書などは、いろいろな会社から届くがゆえにそのフォーマットは様々で、かつ、送付元はお客様企業であるわけで、「こちらの指定するこのフォーマットで注文してください」とは力関係上なかなか言えない、あるいはお願いに応じてもらえないケースも多々あるかと思います。
 こうした同種だけれども形の定まらない帳票に対応できるのが新世代の「非定型OCR」であり、OCR側で読み取った単語がどういった意味で、何の項目にあたるのか、の判断・分類まで自動でやってくれるものになります(「非定型ってなんだ?」)。

 

◆freeFormerとは?その適合する領域

 さて、非定型機能を搭載したAI-OCRのサービスは昨今ではちらほらとみられるようになってきましたが、それですべてのニーズがカバーできたかというとそうではありません。なぜなら、多くのAI-OCRはクラウドサービス型の形態をとっており、そのため、「より広く世間一般に共通のニーズがある帳票」にフォーカスして対応されています。具体的には、請求書、領収書、納品書、レシートといった類の帳票種です。

 そうすると、業界特有の注文書や給与明細、源泉徴収票、クレジットカード明細書、ITエンジニアの職務経歴書など、「ややニッチ」~「完全にニッチ」な領域にある帳票種はOCR処理に対応できないことになってしまいます。これを可能にするには個別の開発を行うしかないのですが、この個別開発をゼロから行うのではなく、非定型モデル開発に共通した部分は再利用できるようにし、より効率良く、よりスピーディーに開発できるようにするため、freeFormerが開発されました。 非定型OCRのロングテール

◆freeFormerの開発工程

 開発着手までは可能な限りフォーマットの種類が違うサンプルを10枚程度ご用意いただき、ヒアリングを経て読み取り項目を決定します。
 読み取り項目が決定すれば、1000枚程度のデータを受領し、アノテーションというAIに学習させるための前準備を進めます。この工程で独自開発のfreeFormerアノテーションツールを使い、AIのためのデータを作成していきます。
 作成されたデータは学習用データ、評価データなどに分けられ、AIに学習させることになります。AIの学習においても、非定型モデリングのノウハウの詰まったfreeFormerフレームワーク上のプログラムが活躍します。

◆自然言語×ビジュアル要素×個別ロジックの項目分類モデル

 freeFormer学習プログラムの一つの特徴として挙げられるのが、文字の位置や大きさといったビジュアル的要素だけでなく、自然言語処理を利用した意味的つながりも分類特定要素の材料として学習するところです。
 このような学習を経て出来上がった統計モデルに、ユーザー企業ごとの若干の個別のプログラムの調整を加えて、非定型モデルが完成します。


◆案件の進め方もパターン化

これまで見てきたように、開発の工程や利用するツール・プログラムが共通化されてfreeFormerを形作っていますが、ユーザー企業の状況や要望に応じて、案件の進め方自体も、ある程度のフレームを作ってパターン化しています。

・プロトタイプ方式

まずは短期間で精度50%~60%程度のモデルを構築するプロトタイプフェーズを設置。プロトタイプが完成した時点で精度の上昇率など踏まえご検討いただき、問題なければ本開発フェーズへ移行するという、投資リスクを最小に抑える形での進め方。

・順次対応方式

帳票フォーマットに対する非定型読み取りの難易度によってモデルの対応状況にばらつきが出てくることがあるため、難易度の低さや全体に占める割合の多さから対応フォーマットの優先順位を設定し、精度が運用可能レベルに到達したものから順次運用に投入し、継続的に後続のフォーマットへの適用を進めていく方式。

・運用開始優先方式

80%~90% のモデル構築を当初から目指し、その結果をもって運用を開始。運用中のデータを使ってさらに運用にフィットする精度まで向上を図っていく方式。

 

 

 以上、簡単な自社フレームワーク「freeFormer」のご紹介でした。

 貴社に存在する、「困った帳票」についてご相談されたい方は、お気軽にお問合せください。上記のフレームにとらわれることなく、実情にフィットした形での案件の進め方もご提案可能です。

jijilla.jp