音声翻訳の自治体窓口業務向けコーパスを追加:情報通信研究機構からの受託事業で凸版印刷が翻訳システムのデータを拡充

課題

日本語の不自由な外国人の増加に伴い地方自治体の職員が日本語以外で対応せざるを得ない自治体が増加しています。さらに、出入国管理及び難民認定法(入管法)が改正され、2019年4月より施行されたことに伴い、さらなる外国人労働者の受け入れ拡大が予想されます。

このような事態に対して、様々な言語に対応できる職員を揃えるのは困難で、技術によるサポートが必要とされています。特に、自治体の窓口業務や学校業務には、他の民間業務や日常会話にない特殊な用語や特別な説明内容などが必要で、これまでのコーパスでは対応しきれませんでした。

解決方法

凸版印刷は、情報通信研究機構(NICT)からの受託事業(2015年度から2019年度の5年間)において、地方自治体の窓口業務や学校業務で必要な語彙や対話例を集めたコーパスを作成したと発表しました。

この事業では、全国約130自治体を訪問してヒアリング調査を実施しました。この際に、窓口における在留外国人との対話内容や、多言語環境整備の実態把握を踏まえ、約50自治体で専用の検証アプリを用いた実証実験を実施したとしています。その成果として、住民登録、国民健康保険、年金、子育てなどの対応で必要な語彙や応対をコーパスとしてまとめ、音声翻訳サービス「VoiceBiz (ボイスビズ)」に実装しました。

今回、自治体の窓口業務向けに拡充された言語は以下のように発表されています。

  • 英語/中国語(簡体字)/ベトナム語/ポルトガル語(ブラジル) 各言語23万文
  • タイ語/韓国語/インドネシア語/ミャンマー語 各言語8万文

VoiceBizの翻訳エンジンはNICT開発のニューラル機械翻訳(NMT)技術を採用しています。また、翻訳結果をSNS/メール等で送信できる「コピー機能」、フレーズを登録できる「お気に入り機能」などの機能が特徴です。あらかじめ翻訳した観光名所、商品名、施設名などの固有名詞、利用頻度の高い定型文を翻訳サーバに登録することも可能です。

すでに音声翻訳できる言語として、日本語からと日本語への翻訳として、英語/中国語(普通話)/韓国語/インドネシア語/タイ語/ベトナム語/ミャンマー語/ポルトガル語(ブラジル)/フランス語/スペイン語への対応がされています。また、テキスト翻訳であれば、英語/中国語(簡体字)/韓国語/台湾華語(繁体字)/アラビア語/イタリア語/インドネシア語/オランダ語/スペイン語/タイ語/デンマーク語/ドイツ語/ヒンディ語/フィリピン語/フランス語/ベトナム語/ポルトガル語/ポルトガル語(ブラジル)/マレー語/ロシア語/ミャンマー語/ウルドゥ語/クメール語/シンハラ語/トルコ語/ネパール語/ハンガリー語/モンゴル語/ラーオ語に対応しているとしています。

https://prtimes.jp/main/html/rd/p/000000363.000033034.html

どうなったか

今回、コーパスが強化されたVoiceBizはiOSやAndroidにより使用することができます。標準価格として、初期費用100,000円で1カ月5,000円/台の契約で使用することができます。 凸版印刷は、さらなるコーパスの追加やサービスの充実で、2020年度中に600自治体への展開を目指すとしています。

まとめ

ニューラル機械翻訳が登場して以来、最先端の機械翻訳技術は汎用化の方向へ向かっていましたが、以前から行われている語彙やコーパスを集める取り組みも同時に行われてきました。今回の事例では、地方自治体などに特化したコーパスを集めて、社会的に有用な応用となっています。医療分野への取り組みなど、専門分野での取り組みもありますが、今後、さらなる機械翻訳の活躍の場としてどのような新規分野が出てくるのか楽しみです。

参考情報

(森裕紀)