教師データを半自動生成:大量の書類を自動でデータ化する「AIよみと〜る」

東日本電信電話株式会社(本社:東京都新宿区、代表取締役社長:井上 福造、以下NTT東日本)はAI inside株式会社(本社:東京都渋谷区、代表取締役社長CEO:渡久地 択、以下AI inside)のAI技術の活用により、高い認識率を実現したOCRサービス「AIよみと〜る」を提供することを発表しました。
課題
最近は申込書、発注書や請求書などのペーパーレス化が進んでおり、個人向けのサービスであっても客が Web で申し込むような形式はもちろんのこと、対面でのやり取りでも営業担当がタブレット端末に打ち込みながら注文を受けるというような形式も増えてきました。
しかし、まだ紙でのやり取りというのは多数派でありFAX や郵送といった手段が使われているのが現状です。紙で受け取ってしまったものは誰かがパソコンなどに打ち込んでデータ化しなければならず、その手間やコストというのは多くの企業にとって課題となっています。
解決方法
今回NTT東日本が発表した「AIよみと〜る」では、AI inside社の技術を使い、OCRで紙の書類を自動でデータ化するようにしました。
OCRは帳票類の読み取りに特化させ、AI inside社のDeep Learning 技術と、歪み・傾き補正機能を組み合わせています。帳票ならではの、枠外にハミ出た文字の推測や、訂正印、枠内で2行に渡って折り返されて記載された文字列なども予測するような工夫がされています。
ITmedia社の取材によると、 精度向上のためには教師データが大量に必要という課題を解決するために、正解データから手書き風の文字をAI(おそらくGenerative Adversarial Networksや変分自己復号化器)により自動生成させて教師データを大量に作り、学習を行う工夫もしたそうです。
どうなったか
2018年8月-9月にメーカー、不動産、サービスといった3社で行ったトライアルの検証の結果、96.71%という高い認識率を達成しました。
すでにトライアルに参加している辻・本郷税理士法人では、税務書類作成のために必要な顧客の通帳のデジタル化を行っています。この作業を今回のOCRとRPAを組み合わせることで、通帳一冊につき1時間程度かかっていたものが、精度はそのままに約10分と大幅に短縮したそうです。
まとめ
今回は文字認識技術を活用した帳票の電子化サービスを紹介しました。
帳票の文字認識においては、単純に文字を100%認識すればいいというわけではなく、文字認識をした後の行程で、訂正印がされているところは除外するだとか、一つの枠内で複数行にわたって書かれている可能性があったり、枠外にハミ出てしまっている場合もあるという処理をする難しさがあるのだと知ることができました。
以前紹介したNECの「NEC AI-OCRサービス」では、文字認識の前工程に当たる帳票定義の部分を自動化していました。単純な文字認識ではある程度の精度が誰にでも出せるようになっている現在では、こういった文字認識処理の前と後の工程の充実が各社のサービスの優劣を決めていきそうです。
参考資料
- 手書き帳票データ化サービス「AIよみと~る」などの提供について[@Press]
- AIよみと〜る|AI-OCR|サービス|法人のお客さま[公式サイト]
- 「情シスない中小企業に使ってほしい」 NTT東日本、「AI-OCR」とRPAサービス提供 紙帳票のデータ入力を効率化[ITmedia NEWS]
- AIがOCRの帳票定義を自動化。伝票処理を75%効率化も[Marvin]
(Marvin編集部)