ローコストでの教師データ作成サービスの提供を:「アノテーションセンター」がベトナムに開設

課題

機械学習の活用が、現在さまざまな場面で進んでいます。機械学習では、業務の特性や性質を熟知した人が、解かせる問題を定義し、その上で場合によっては数万~数百万件のデータに対し、大量かつ高品質の教師データを用意して学習させることが必要です。すなわちこの「教師データの作成(=アノテーション)」が機械学習を利用する際に重要なものとなります。

しかし、機械学習に最適な教師データを大量・高品質・効率的に作成するためのリソース・管理体制・ノウハウを自社だけでもつことは容易ではなく、教師データの準備に時間やコストがかかったり、そもそも用意できなかったりと、機械学習活用のボトルネックとなっています。

解決方法

安価で高品質な機械学習の教師データの作成を目指して、トランスコスモス株式会社が、その拠点としてベトナムにアノテーションセンターを開設しました。

同社はすでに、2017年11月には横浜に30席規模のセンターを、同年12月には沖縄に60席規模のセンターを開設しています。さらに、transcosmos Vietnam co., ltd.(本社:ハノイ)内に、40席規模の「アノテーションセンターベトナム」を2018年9月1日に開設することを発表しました。これらのアノテーションセンターを連携させ、アノテーションの企画から教師データの作成まで、日本の企業向けに機械学習プロジェクトを推進するためのアノテーションサービスを提供するということです。

どうなったか

アノテーションセンターにより、企業の機械学習プロジェクトにおいて最適な教師データを作成するためのアノテーション企画・設計サービスが提供されています。また、大量の教師データを効率よく作成するためのアノテーションツールの開発も進められ、高品質な教師データ作成を実現することが目指されています。

アノテーションサービスとしては、音声データに対して、正解の書き起こし文字データを作成したり、音声認識ソフトで書き起こした文字データを修正したりする「音声アノテーション」、チャットbot用FAQのように、想定される質問に対して回答を作成する「テキストアノテーション」、画像データに対して年齢や性別といったラベルを付与する「画像アノテーション」などが用意されています。

そして新たに開設される「アノテーションセンターベトナム」では、今後「アノテーションセンター沖縄」との技術交流によって、日本の業務構築・品質管理に基づいた高品質なアノテーションサービスを、ローコストで提供するとしています。

まとめ

機械学習、特に近年成果を上げているディープラーニングにおいては、一般に大量のデータが必要となります。しかし、大量かつ高品質なデータを作成するアノテーション作業には困難が伴います。

そのため、アノテーション作業を支援することを対象としたサービスが、今後大きなビジネスチャンスにつながることが予想されます。本サイトでも、各種アノテーション作業支援サービスについて、以前に紹介しています。(ディープラーニングの学習データ作成が容易にできる!アノテーション作業支援サービス「DeLTA-Mark」提供開始)今回紹介したように、海外拠点との連携によってローコストでサービスを提供するなど、新たなアイデアでより良いサービスが生み出されることが期待されます。

 

参考資料

AI・機械学習の教師データを作成するアノテーションセンターをベトナムに開設 [トランスコスモス]
教師データ作成に専門特化したアノテーションセンターを開設 [トランスコスモス]
ディープラーニングの学習データ作成が容易にできる!アノテーション作業支援サービス「DeLTA-Mark」提供開始 [Marvin]

(太田博己)