手書きの領収書や申込書など、非定型フォーマットの手書き文字を読み取り可能なOCR「スマートOCR非定型手書き」がリリース:クラウド・オンプレミス版で提供

課題
光学文字認識(OCR)は、画像内の文章にある文字を読み取り、文字コードの列として自動変換するソフトウェア技術です。
従来のOCRは、文字の位置が指定された定型フォーマットからのみの文字読み取りが可能で、非定型の手書き文字の認識は困難とされていました。近年では、深層学習の応用により、くずし字の文字認識研究を一例として、場所の指定のない手書き文書のOCRの性能が向上し、企業での日常業務への応用が課題となっています。
解決策
株式会社インフォディオが開発・提供を行うOCRサービス「スマートOCR非定型手書き」では、様々なフォーマットの手書き文字や、活字混在帳票からの文字認識・データ化が可能となっています。
同サービスは従来のOCRのように、フォーマットが異なる度に位置定義を変える必要がなく、例えば手書きの領収書や発注書、手書きの棚卸帳票などの様々なフォーマットからの文字認識が可能です。
この他、同サービスで読み取り可能な非定型の手書き文書の例として、例えばバックオフィス分野では履歴書や勤怠管理表、源泉徴収票などが挙げられます。また医療分野ではカルテや介護記録、教育分野では答案、申込書、願書などが挙げられます。
どうなったか
スマートOCR非定型手書きは2019年10月8日から提供を開始しており、クラウド版・オンプレミス版の両方が利用できます。
非定型フォーマットの手書き文字を認識可能になることで、バックオフィス分野などの様々な分野で、業務効率の改善が見込まれます。
同社は今後、様々な非定型手書き帳票に特化した、パッケージ版のスマートOCR非定型手書きも発売する予定ということです。
まとめ
OCRの歴史は古く、現在でも最新のAI(人工知能)技術を取り入れながら進歩を続けています。特に、深層学習を用いた現在のAI(人工知能)は、古代や近世のくずし字を含む多様な個性のある手書きの数字や文字であっても、極めて正確に認識します。
こうした手書き文字認識技術は、過去の文書の電子化をはじめ、現在のワークフリーの中での業務効率を改善するツールとして、活用が進んでいきそうです。
参考資料
- 人工知能により手書き領収書・発注書などの”非定型手書き文字帳票”の読取りが可能な「スマートOCR非定型手書き」をリリース [PRTIMES]
- 「くずし字」をAIで解読する研究がますます盛んに:機械学習と人文系の分野横断的研究も [Marvin.news]
- くずし字認識のKaggleコンペ開催:人文系データ対象は今回が初 [Marvin.news]
(Marvin編集部)