アストラゼネカと情報通信研究所が医薬分野に特化した機械翻訳の共同研究契約を締結
課題
アストラゼネカは、情報通信研究機構(NICT)と医薬分野に特化した翻訳システムの共同研究契約を締結したと発表しました。
医療分野の翻訳は各国の医療制度や言語が異なる中で医薬品の許認可などを迅速に進めるために翻訳速度と精度の向上が求められていました。
NICTはこれまで、再帰結合をもつニューラルネットワークを用いた機械翻訳システム(NMT: ニューラルマシントランスレーション)を含む翻訳システムの開発を継続しており、TexTraと名付けた翻訳サービスも公開してきました。その技術を応用して医薬部門に特化したシステム構築を目指します。
解決方法
機械翻訳に使用されるNMTは、言語の文法構造などを陽に扱うことなく対訳文同士をそのまま入出力とさせるような学習を行うシステムで、2016年に刷新されたGoogle翻訳の内部アルゴリズムに採用され、その自然な翻訳文の生成は驚きをもって迎えられました。NICTでは、従来型の統計的手法を用いた機械翻訳システムの開発と共に、独自のNMTシステムを開発して、特に日本語と他の言語との翻訳精度の向上を目指してきました。
機械翻訳を実現するためには、翻訳対象の言語間で対応する例文を用意する必要がありますが、専門性の高い用語や言い回しなどに対応するためには、一般的な文章に関する対訳だけでは不十分であり、その専門領域の知識に基づいた対訳や単語集が必要となります。NICTは、これまでに総務省と共に「翻訳バンク」を運用して、日本語と様々な言語の間の翻訳データを収集しています。アストラゼネカの強みは医薬分野の専門性の高い対訳を準備することであり、医薬分野の翻訳精度の向上は同社のニーズにも合致しています。
また、翻訳バンクでは、製薬会社のMSD株式会社との契約してMSD社のデジタル医学事典「MSDマニュアル」の10言語のデータの提供を受け、多言語音声翻訳アプリ「VoiceTra」(ボイストラ)の医療分野における翻訳精度の向上を目指すなど精力的な取り組みを行なっています。
どうなったか
アストラゼネカは医薬分野の専門性の高い対訳を提供して、この対訳データを基にNICTは機械翻訳システムの向上を目指します。また、共同で翻訳精度の検証を行います。
アストラゼネカはこのデータによりカスタマイズされた翻訳システムの使用する権利を得る契約となっています。
まとめ
NMTは、文法の構造や明示的な単語の対応関係を考慮せずに異なる言語間の同一の意味の文と文を対応させるため、あらかじめわかっている単語の対応や分野毎に異なる専門用語の使い方が明示的に決まっていたとしても、そのルールの取り込み方に課題があります。このような問題は、NMT以前からの文法構造の知識を陽に利用したシステムの研究開発の成果をうまく利用することで解決されるのではないでしょうか。技術的な動向にも注目です。
いずれにしろ、専門性の高い翻訳技術は一定以上の翻訳精度が得られるなら、需要の高い分野だと考えられます。誤訳のリスクとのバランスをどのようにとるのかは注目されますが、医薬品以外の法律や技術マニュアルの翻訳なども今後導入が進んでいくでしょう。その際には、翻訳者の役割も変わっていくのかもしれません。
参考資料
アストラゼネカ
情報通信研究機構(NICT)
TexTra[nict.go.jp]
国立研究開発法人情報通信研究機構とMSD株式会社 AI多言語音声翻訳アプリ「VoiceTra」(ボイストラ)に、医学事典「MSDマニュアル」の10言語翻訳データを活用することで合意[nict.go.jp]
2-F オールジャパンで対訳を集める活動~みんなでニューラル機械翻訳を育てよう! そのための課題と対策~[日本翻訳ジャーナル翻訳の現在を知る]
ニューラル翻訳(NMT)の実体とその周囲の実態に迫る
~NMTとの良い関係の確立を~[日本翻訳ジャーナル翻訳の現在を知る]
翻訳界に、Game Changer『使える自動翻訳』が、降臨![日本翻訳ジャーナル翻訳の現在を知る]
(森裕紀)