情報通信研究機構とトヨタがニューラル翻訳技術を用いた自動車法規文翻訳の高精度化を発表

課題

自動車や自動車部品の設計、製造、輸出では、安全確保・環境保護などのさまざまな観点から、各国が定める法規の要件を満たすことが求められます。そのためには、頻繁に改訂される各国の法規を迅速かつ正確に理解する必要がありますが、人による翻訳に依存しているのが現状であり、翻訳の精度を保つのにも時間がかかっていました。法規情報の理解の高速化と高精度な翻訳は、自動車業界の業務効率化の鍵となっています。

解決方法

情報通信研究機構(NICT)は4月23日、トヨタ自動車との共同研究により自動車に関する法規文の自動翻訳の高精度化に成功したと発表しました。

対象となるのは英語から日本語、中国語から日本語の翻訳です。NICTは、トヨタが提供した自動車法規に関する英日・中日翻訳データをもとに、汎用英日・中日ニューラルネットワーク翻訳エンジンのアダプテーションを行い、実用度を向上させました。アダプテーションとは、翻訳バンクで追加した翻訳データを用いて、精度を改善するためトレーニング済みのニューラルネットワークをさらに調整することです。

この成果ではNICTがこれまで取り組んできたニューラル翻訳技術を用いており、膨大な対訳データを用いて対応関係を学習します。(ニューラル翻訳技術についてはMarvinでも紹介しています。「アストラゼネカと情報通信研究所が医薬分野に特化した機械翻訳の共同研究契約を締結」「文書の専門分野の自動判定による翻訳精度向上:ロゼッタが多言語で医学、化学、法務、IT、金融など可能とする新しいバージョンの機械翻訳サービスを公開」「「TOEIC950点に匹敵する日英機械翻訳」:みらい翻訳が情報通信研究機構との共同研究成果を発表」)

どうなったか

トヨタが提供した自動車法規へ対応した後に実用度を評価したところ、英日翻訳は自動翻訳エンジンの約24%、中日翻訳は、約11%の実用度向上という結果となりました。これを受け、さらに向上させる研究が継続することとなりました。

まとめ

NICTは2017年から総務省と連携して、翻訳データを集積する「翻訳バンク」を運営し、製薬会社をはじめとして多数の組織からデータの提供を受け、翻訳データの集積・活用を進め、日本語の翻訳技術の多分野化・高精度化に取り組んでいました。(そのデータを活用してNICTが開発したものには音声翻訳アプリVoiceTraや文字ベースの自動翻訳システムTexTraがあります。)

法規の翻訳は自動車にとどまらず、輸出される全ての生産物に対して需要があり、英語だけでなく中国語を含む多言語への対応が有用です。今後は、①さらに多言語にすること、②法規だけではなく多種多様な文献に展開すること、③自動車産業全体に広げること、④広域にわたる輸出産業に広げることを目指すとしています。

参考資料

(蒲生由紀子)