採点者によって評価に差が出がちな英語スピーキングをAIで自動採点:Z会とEdulabが共同研究計画を発表

課題
従来の英語教育では、もっぱら文法・読解力に特化した教育が行われてきましたが、グローバル化が進むにつれて、話す・聞く等の実践的な技能も重要視されています。
こうした背景に伴い、学習指導要領の改訂や、従来のセンター試験に代わって2020年度から実施される大学入学共通テストの英語試験では、読む・聞くに加えて書く・話す技能の試験が新たに導入されます。
しかし、スピーキング力の測定を人間が行う場合、採点者によって評価にばらつきが出たり、人件費がかかるといった課題があります。
解決策
英語のスピーキング力の採点AI(人工知能)で自動化する取り組みを行っているのが、教育ITシステム開発を手がけるEdulabとZ会です。両社は2019年9月10日、スピーキング能力の測定、および採点を音声認識により自動で行う技術の共同研究を始めたと発表しました。
この技術の開発にあたり、Edulabが開発する音声認識技術を用いた自動採点技術と、Z会が実施する「英語CAN-DOテスト」で得た、数万点に及ぶ音声データと評価データを活用するとしています。同テストは2018年には約8,000人が受験しており、収集したデータは自動採点技術の機械学習モデルの訓練に使用される模様です。
また、日本の英語教育の汎用枠であるCEFR-Jの開発を務めた東京外国語大学大学院の投野由紀夫教授も監修として参加し、自動採点技術の信頼性や妥当性などに関してアドバイスを行うとのことです。
音声認識は、文章の自動入力や、Google HomeやAmazon Echoをはじめとした音声入力の分野で目覚ましい成果を挙げています。数年前までは隠れマルコフモデル(HMM: Hidden Markov Model)に基づく計算モデルが主流でしたが、深層学習に導入により、性能が飛躍的に向上しました。今回の共同研究でも、深層学習ベースのモデルにより認識の精度だけでなく、英語を母語としない話者の発音に基づいて採点モデルを構築することで、採点精度の向上を図るのではないかと考えられます。
どうなったか
今後、自動採点技術の精度向上を目指して開発を行い、研究成果を学会で共同発表する予定としています。同技術が実用化されれば、スピーキング試験の採点基準を均等化することが可能になる他、採点者による評価基準の差をなくすことで、採点結果の公平性を担保することが見込まれます。
この他、採点の自動化によって人間の採点者を用いる必要がなく、人件費のコスト削減も可能になります。
まとめ
英語のスピーキング力やライティング力を測る際、発音や表現などにおいて明確な正解というものがなく、採点者の評価基準を統一することが困難です。このため、現在ではAI(人工知能)で採点を自動化する技術が開発されており、こうした技術は今後、各種英語検定試験において導入が進みそうです。
しかし、こうした自動採点技術は現時点である程度の精度を達成しており、日本英語検定協会は2019年度より英検のスピーキング・ライティング試験の採点にAI(人工知能)を導入しています。この他、AI(人工知能)チャットボットとの会話を通じて英会話学習する「スピークバディ」などのアプリもリリースされており、外国語学習の分野でもAI(人工知能)の普及が進んでいます。
参考資料
- Z会、英語スピーキングの採点をAIで自動化へ 公正な採点を低コストで実現する狙い [ITMEDIA]
- Z会xEdulab、AIによるスピーキング自動採点の共同研究 [RESEMOM]
- 英検の採点にAI ライティング・スピーキングも自動採点 [ITMEDIA]
(Marvin編集部)