企業活動の情報を世界へ発信:IR情報の自動翻訳精度向上へ日本取引所グループとロゼッタが実証実験

課題

日本企業の世界的な展開が期待される中、英語が主言語である世界経済への進出には依然として言語が壁となっています。

企業が投資家から資金を集めるための情報発信として投資家向け情報(以下、IR情報)を含めた「適時開示情報」が日常的に発信されていますが、日本企業の場合、日本語での情報公開が多く日本市場が世界の投資家から資金を集めるために不十分な状況です。IR情報などが人間の翻訳者を介在せず自動翻訳技術を用いて翻訳され、低コストでタイムラグなしに世界に情報発信できれば、日本の投資市場の活性化も期待できます。

 

解決方法

適時開示情報の自動翻訳精度向上を目指して日本取引所グループと株式会社ロゼッタ(以下、ロゼッタ)は2018年9月より共同の実証実験を開始します。

日本取引所グループでは企業からの「適時開示情報」を収集、整理して公開しており、データが蓄積され、ロゼッタは医薬、法務、金融などの専門的な翻訳サービスを提供しています。

両社が協業することで、日本企業情報の世界発信を目指します。

どうなったか

この実証実験では、ロゼッタの自動翻訳システムを用いて過去のIR情報などの適時開示情報を大量に自動翻訳して誤訳のパターンを洗い出し、実用化の可能性を検討します。

まとめ

この実証実験では一足飛びに機械翻訳を応用したサービスを提供するのではなく、まずは誤訳のパターンの洗い出しから着実に始めます。機械翻訳では、対訳データを前提として、その変換としての翻訳システムの構築を目指しますが、多くの場合対訳データが存在しないため、この案件ではひとまず既存システムでの機械翻訳を進めて、改善点を探るようです。

技術的に機械翻訳では情報が正確に翻訳できるかどうかに保証が難しいのが問題です。例えば、否定のための単語「〜でない」や「not」が無視されてしまうと、逆の結果が出力されてしまい、その翻訳結果を基に意思決定する場合には致命的です。

機械翻訳では、自由な文章か定型的な文章か、正確性が求められるかどうかが問題となりますが、Google翻訳などで採用されているニューラルマシントランスレーション(NMT)は自由な文章を前提としつつ翻訳の品質が保証できないのに対して、企業の適時開示情報の翻訳は定型的な内容も多いものの正確性が厳しく問われます。これまでMarvinで紹介した医薬品のための機械翻訳に関しても、内容は定型的ですが正確性が求められます。

ロゼッタは翻訳技術の中身について詳しく公開していませんが、ロゼッタの機械翻訳サービスT-400では「汎用的な自動翻訳とは異なり、分野ごとに自動翻訳をチューニングすることで、最大95%の精度で翻訳します。」としており、分野を限定して、顧客の要望に合わせてカスタマイズすることで翻訳精度の向上を図っているようです。

NMT以前からの言語構造の理解を基礎とした機械翻訳技術は、NMTに比べて自然な訳文の生成や自由な文脈での翻訳に弱点があるものの明示的なルールによるカスタマイズが比較的容易だと考えられます。今後は、NMTと従来型の機械翻訳技術を融合させて、文脈の自由度と正確性を同時に高めていくような方向に向かうでしょう。

参考資料

人工知能によるIR情報の自動翻訳の精度向上に向けて、日本取引所グループとロゼッタが実証実験を開始 [PRTIMES]

適時開示情報閲覧サービス[日本取引所グループ]

ロゼッタ公式 [rozetta.jp]

アストラゼネカと情報通信研究所が医薬分野に特化した機械翻訳の共同研究契約を締結 [Marvin.news]

(森裕紀)