請求書の読み取りから仕訳までをAIが自動化:100枚を3分で処理する「sweeep」

AIの活用事例として受け取った請求書を読み取りデータ化、100枚をたった3分で処理するというシステム「sweeep」を提供するオートメーションラボ株式会社(東京都港区)にお話を伺いました。

課題

このシステムは、どのような課題を解決するために考えられたものなのでしょうか?

「10年以上BPR(業務改善)のコンサルティングをしてきた中で着目するようになりました。経理において決算早期化・業務効率化を妨げる典型的な業務が2つあります。ひとつは売掛債権と実際の入金を照合する「消込」という業務。そして、もう一つが「請求書の処理」です。どちらも月初の忙しい時期に集中して作業する必要があり、決算のボトルネックになることがよくあります。

特に請求書の処理はERPなどの基幹システムが進化した今でさえ、効率化・自動化の流れから取り残されてきた業務です。未だに数名の経理スタッフが数日の間にひたすら請求書をみて、手で仕訳登録していきます。

なぜシステム化が進まないかわかりますか?「紙」だからです。

EDIなどの仕組みが整っている一部の企業を除き、請求情報は請求書という紙媒体でやりとりされています。このアナログデータをデジタル化して初めて社内のシステムに請求情報を取り込んできました。手入力するしかなかったということですね。

更にもう一つ。請求書には勘定科目などの仕訳情報は書かれていません。請求書に書かれている情報から取引内容を把握し、熟練の経理スタッフが簿記知識や経験から仕訳情報に変換します。

現状、経理部門の最たる仕事は決算です。決算を締める、数字を固めることに主眼が置かれています。しかし、本来の役割はそうではありません。決算の数字をつかって、経営に資するデータを提供することが経理の本来の役割と考えてきました。

請求書の処理を自動化することが決算の効率化につながり、そのことで分析や企画業務にシフトできることを願っています。」

解決方法

そのような方法に対してどのような解決方法を作られたのでしょうか

「請求書をスキャンするだけで仕訳が自動作成できるようにしました。

図1. 請求書(右)がOCRされ、仕訳がされている様子

これまで熟練スタッフがやってきた紙の情報をデータに起こす、請求書の内容から適切な仕訳を作成するという作業を自動化したのです。この中で我々はOCRやAIといった技術を使っています。OCRという技術は古くあるもので、私がBPRのコンサルティングを始めた10年以上前から請求書の読み取る試みは行われてきました。しかし、どのプロジェクトも大きな改善を果たすことができてきませんでした。

OCRの技術は日々進化をとげています。手書きの文字であっても昔に比べて読み取り精度は格段にあがってきました。しかし、請求書の処理には効果を発揮していません。

理由は請求書の特性によるものです。請求書は発行する会社によって各社各様のレイアウトです。この点が処理を難しくしています。OCRソフト上でレイアウトを定義することでこの問題はある程度解決できますが、今度はその定義に時間がかかってしまいます。新しいレイアウトの請求書は都度増えていくからです。

我々はAI技術と組み合わせることで、このレイアウト定義をなくすことに成功しました。レイアウトを定義しなくても請求書のどこに何が書かれているのかを自動判別します。更にそこで読み取った内容をもとに仕訳の判定を行います。ここにもAI技術を使っています。

最近、請求書をPDFでやりとりすることも増えてきました。これによりOCRが不要となるケースも増えてきました。しかし、レイアウト定義や仕訳判定のスキルは人間に頼らざるをえないのが現状です。そこを代替できるのがsweeepです。」

ありがとうございます。AI技術を使ってレイアウトの問題を解決されているということですが、苦労した点などがあればお伺いしたいです。

「コアとなる技術なので開示は難しいですが、苦労したことと言えば、各社各様のレイアウトを如何に正確に認識するかという点です。当たり前ですが・・・

特に文字の読み方です。文字の読み方は個別論点でレイアウト、すなわち文書を全体的に捉えるということと関係ないと思うかもしれません。しかし、レイアウト、どこにどんな情報が書いてあるかを認識する上で重要な要素です。

どんな文字が難しいかというと罫線や点やスペースなど情報量の少ない文字を人間と同じように判別することです。例えば点という情報は少数点にもにもなり得るし、文字を分ける区切りにもなり得るし、ただのチェックかもしれません。

人間はそれを前後の文字の意味や配置されている位置によって、意味を認識しています。それと同じことをAIにもやらせる必要があり、とても苦労しました。」

どうなったか

このシステムを使うと何がどの程度改善されるか教えてください。また今後の開発予定、目標数値などがあれば教えてください

「最大90%程度の業務時間を削減することができます。また、決算早期化のボトルネックを解消できます。

回覧やファイリングや探す行為などの周辺の業務を入れると請求書1枚あたりに10-30分の作業時間がかかっていると言われています。単純に請求書をみてシステムに登録するだけでも1枚あたり2-3分の時間がかかります。一方、sweeepは1枚の読み取りに1.5秒もかかりません。チェックや承認作業を含め1日で1000枚の請求書処理を終えることも可能です。」

図2 スキャンされデータ化された請求書の一覧画面

1日で1000枚はすごいですね。現在どのような業種や規模のお客様が多いのでしょうか。

「様々な業種からお問い合わせいただいております。IT、人材、不動産、広告、製造業、インフラ、学校、会計事務所・・・全業種からですね!請求書のこない会社はないですからね。規模でいうと月間100枚程度の中小企業から月間数万枚の大企業までこちらも幅広いです。中でも500ー3000枚ぐらいがボリュームゾーンと言えますね。」

まとめ

請求書を自動で処理するシステム「sweeep」の話を伺いました。
他社から送られてくる書類というのはこちらでフォーマットできないことが普通で多くの企業がその処理に人手を割いているのが現実です。Marvinではこれまでも書類を OCR で読み取るようなシステムは紹介(例1. 例2)してきましたが、今回の「sweeep」は「電子化の部分だけ」というようなプロセスの一部分を切り出すのではなく、特定の帳票に特化することで、その書類の処理の完了(会計の仕訳)というところまで持って行ってくれるというのが現場にはとても嬉しいことなのではないかと感じました。

参考資料

請求書AI-OCR sweeep[公式サイト]

(Marvin編集部)