電子カルテから必要な情報を取り出す:人工知能による円滑な情報共有のための電子カルテ構造化技術

課題

患者の病状を記録するカルテ(診療録)は医療従事者にとって重要な情報源です。近年ではカルテの電子化が進み、病院内外でカルテを共有することも可能となっています。一方でカルテの書き方や記載情報の粒度は医師によって異なるため、病院を越えて連携を取る場合には患者のカルテから必要な情報を素早く、正確に把握する必要があります。しかし、自身の執筆様式と異なるカルテから重要な情報のみを読み解くことは、医師にとって大きな負担となります。
このようなカルテからの情報抽出に関する問題に対して、きりんカルテシステム株式会社(以下きりんカルテ)は医師が記入したカルテ情報から必要な医療情報だけを抽出・構造化する医療言語処理エンジン「きりんカルテDX」を開発しました。

解決方法

カルテDXでは電子カルテに記載された言語情報から重要な情報を選択・抽出し、医療現場における標準的な記載形式に変更した構造化カルテを生成します。この機能を実現するためにきりんカルテでは日本マイクロソフト株式会社(以下マイクロソフト)が提供するMicrosoft Azure Cognitive Servicesの言語処理に関連するサービスを利用しています。Cognitive Servicesの言語処理に関するサービスは複数提供されていますが、きりんカルテDXにおける情報の抽出と構造化には主に「Text Analytics API」が利用されていると思われます。Text Analytics APIでは入力された文章に対して、重要なキーフレーズの抽出やエンティティ識別をすることができます(エンティティ識別とは、語が表す個性の推定。例えば「はし」が橋なのか箸なのかを文章の流れから識別すること)。これによりカルテ内の重要な情報やその意味合いを認識することが可能です。Text Analytics APIの利用に関してはこちらこちらをご覧ください。
またTXP Medical株式会社と協力し、同社の持つ医療現場ノウハウと医療専門用語の変換技術をカルテ構造化技術構築に応用しました。

どうなったか

通常のカルテとは異なり、構造化カルテでは症状の有無や既往歴名(過去の病気の記録)、常用薬名とその分類コードによって構成されます。現在のきりんカルテDXでは、検証のために作成した約200件のサンプルカルテに対して80%の分類精度で構造化カルテを生成することができたようです。本サービスの提供はまだ開始しておりませんが、きりんカルテでは同社が提供する完全無料クラウド型電子カルテ「カルテZERO」の利用機関や地域医療連携モデルでの実証実験を通じて分類精度の向上を目指すようです。

まとめ

きりんカルテは一般的な電子カルテから患者や治療にとって重要な情報を抽出し、構造化カルテを生成する医療言語処理エンジンきりんカルテDXを開発しました。きりんカルテではこれまでに完全無料クラウド型電子カルテ「カルテZERO」を商品として展開していたことから、今回のきりんカルテDXの開発に必要なデータを大量に収集することができたと考えられます。
ここ数年人工知能技術を利用したサービスが様々な企業から展開されていますが、今回紹介したきりんカルテDXのように別会社の開発するAPIを利用した事例も数多くみられるようになりました。Microsoft Azure Cognitive Servicesだけでなく、IBMのWatsonやリクルートが開発するA3RT(アート)など、目的に合わせたAPIを利用することで開発コストの削減やと短期化が期待できます。これらのAPIに関してはこれまでの記事(例えばこちらこちら)でも紹介していますので是非ご覧ください。

参考資料

(堀井隆斗)