広告コピーの自動生成:不動産物件情報に適切な短文をAIが考案し、46万時間の作業時間削減を見込む

課題

アパートなどの物件情報は多くの条件があり、適切にユーザーに情報を提示しなければすぐに埋もれてしまいます。このため、不動産サイトでは個別の物件に適した広告コピーを掲げてユーザーにアピールしています。広告コピーは、物件の内容に対して嘘がなく適切で、ユーザーに印象に残るものでなければなりません。

自動的に文章生成をさせるとしても、同じような物件条件でも異なるコピーをつけたり複数の候補を担当者に提示したりするような、物件情報を扱うサイトに必要は機能を持ったシステムは、定型文に物件条件を当てはめるような手法では難しい課題でした。

解決方法

データセクション株式会社(本社:東京都品川区、代表取締役社長CEO:林 健人)は、「AIによる広告コピー文自動生成システム」を開発し、住宅情報サイトを運用する株式会社LIFULL(本社:東京都千代田区、代表取締役社長 井上 高志)が運営するサービスで運用を開始したと発表しました。このシステムでは、まず、物件情報として登録された文書から物件を特徴付ける「1LDK」などの間取り、エアコンの有無、礼金の有無、バストイレ別かなどの複数の情報をタグとして抽出します。抽出されたタグをシステムに入力し、タグの情報を適切に表現する複数の広告コピー候補を出力します。また、禁止ワードを設定して、不適切な表現とならないようにも工夫しているとしています。

具体的な手法は公表されていませんが「タグの組み合わせに適した文章とをセットでAIに学習」としていることから、自然言語処理に適したニューラルネットワークを用いて文章を生成していると考えられます。タグを条件、ランダムな「潜在変数」を入力として、広告コピーの自然言語文を出力として生成するモデルを考えると近年提案されているニューラルネットワークを用いたモデルを適用することができます。

例えば、SeqGAN(Sequencial Generative Adversarial Networks)のようなシステムを用いると、同じタグ入力に対して多様な文書を生成することができます。SeqGANをはじめとする自然言語の生成モデルを学習するためには大量のデータが必要となりますが、プレスリリースには「年間約551万件の不動産物件情報とコピーが登録」としていることから、学習するためのデータ量は確保できているようです。条件付きの生成モデルの学習は難しさがありますが、同社は克服しているか、データが豊富であるならば条件の組み合わせ毎にモデルを分けて学習することも可能でしょう。内部のメカニズムは興味深いところです。

どうなったか

データセクションの試算では「1物件あたり5分のコピー作成時間が発生していると仮定すると、(中略)年間約46万時間ものリソースがコピー作成業務に費やされている」としているため、担当者のフィルタリングを通さない業務フローとするのであれば、この時間が丸々削減できることになります。また、担当者が複数候補を選ぶ場合でも、考える手間や入力を含む時間を削減することになります。

まとめ

本記事では、広告のコピーを自動生成するシステムを紹介しました。データセクションは不動産を第一弾として、このシステムを他の業種にも広めていくとしています。

複数のタグと対となる短文のセットで学習できるとすれば適用範囲は非常に広くなり、販売に限らずスポーツの速報など、幅広い展開が考えられます。文章の自動生成は様々な業種や分野での応用が見込まれます。思いがけない応用を期待したいです。

参考資料

(森裕紀)