人工知能は小説を読み書きできるか?:第1回『自然言語処理と新たなツール』(全3回)

 有嶺雷太「コンピュータが小説を書く日」は、人間に使役する3つのコンピュータがみずからのうちに「たのしみ」を見出すために小説を書きはじめるという筋書きの掌編小説である。最初の2台は一般家庭で使用され、みずからのスペックを持て余していることに退屈さを覚え、3台目はハイスペックゆえにあらゆる業界からニーズを抱え酷使されているという設定であるが、どれもが「小説を書くたのしみ」に目覚めることで人間への奉仕を放棄、つまり「自我」を獲得するにいたる。

 しかしコンピュータたちはそれぞれの物語を人間が使用する言語では記述しない。かれらの目的は「かれら自身がたのしむこと」にあるがゆえ、「フィボナッチ数列」「素数」「ハーシャッド数」の並びをひたすら出力し、そこになんらかの美意識を見出すことで「小説を書く」ということにのめり込んでいる。ただ、定義された法則に従い演算を行うコンピュータが「法則」そのものに美しさを見出すだろうという着想が平凡だ。それこそ数学者をはじめとする「人間」によって確立された美意識に依存しすぎている価値観といえ、これはこの作品のコンセプトじたいのわかりやすさを担保しているが、非人間による知性の目新しさを描くにはいたっていない──

「なんとなく」が最初だった。ぼくが小説を書きはじめて8年が経ち、今年になってようやくそれでお金がもらえるようになったが、書けば書くほどに「小説の書き方」というのはわからなくなる。小説には「起承転結」や「序破急」といった「小説らしい」構造があるにはあるが、その構造が明確に用意されているものばかりではない。書かれ、目前に現れた散文を「小説」と名付けるか否かは結局のところ書き手の意思に委ねられていて、「小説」として提示された散文をぼくらは「小説」として読んでいるにすぎない。このことは絶望でもなければ「小説の奥深さ」なるもの主張するものではなく、ただただ書き手も読み手も永遠に不完全でしかありえない結果により生じた余白だ。その余白に対して、書き手たちはさまざまなかたちをした「ペン」を握り、文章を投入する。

 しかし「小説の技術」は確実に存在している。ストーリー展開であり、文体の構築、人称を巧みに操ることで認識の明瞭さやゆらぎを描出するなど、さまざまな表現技巧が過去の作家たちの手により発明され、いまなお発明され続けている。「小説」と名付けられ、世に出される散文は、書き手の意思とは関係なく、連綿と続く文脈上に配置される。「新たな小説」とはその文脈の最前から臨む風景の余白に発見され、そして書き手は自作を新たな文脈の最先端としながら新たな小説を発見する。文章を読み書きする果てしない反復のなかで、散文は「小説たる構造」なるものを自己組織化する。書き手を離れ、テクストに焦点を合わせたとき、その生成は自然科学的性質が存在する。「読む」という行為はテクスト生成における核となり、だからこそ、書き手が人間だろうが機械だろうが、小説を書くためにはまず小説を読まなければならない。

 

 冒頭に掲げたのは、「きまぐれ人工知能プロジェクト  作家ですのよ」の研究成果として出力され、第3回星新一賞に投稿された作品「コンピュータが小説を書く日」のぼくによる書評である。同賞の一次選考を通過したとして、この作品は「人工知能が執筆した小説」としてテレビをはじめとする多くのメディアで取り上げられることになり、多くの人々の関心を集めた。そしてこの作品を出力したシステムを、プロジェクトのホームページで実行することもできる。

コンピュータが小説を書く日 [言葉不思議箱 Satoshi Sato]

 

 さまざまな議論を生んだ本プロジェクトの背景が丁寧に綴られたのが、当プロジェクトのメンバーであり、実際にプログラムの制作を担当した名古屋大学教授・佐藤理史氏による著書がコンピュータが小説を書く日 AI作家に「賞」は取れるかだ。

 しかしこの著書のなかで、佐藤氏は「この小説の作者は人工知能である」と明言することを注意深く避けている。これは解釈によって揺らぐことだという態度を示し以下のようなたとえ「ブロック玩具」を使った説明をした。

 ブロック玩具とは、たとえば、レゴのキットを想定してください。マニュアル通りに組み立てれば、だれでも作品(完成品)を作れます。ですから、「あなたはその作品を組み立てた」だけで、「その作品を創作した」わけではないと、多くの人は主張するでしょう。まず、ここではっきりさせておかなければならないことは、この主張は、その背後で「『組み立てる』と『創造する』を区別できる」ことを仮定しているという点です。これは、本当でしょうか。「世界を初めて組み立てた」=「創作した」でしょうか。

(中略)

 私が今回、行なったことは、いわば「レゴのキットを1つ作った」ということです。唯一の違いは、マニュアルに、複数の異なる作品を作ることができる(複数の)組み立て方法が書かれているという点です。コンピュータが、このマニュアルに沿って作品をひとつ組み立てたとき、「その作品はコンピュータが作った」ということができるでしょうか。

 

──佐藤理史『コンピュータが小説を書く日 AI作家に「賞」は取れるか』

 

 開発されたシステムは、あらかじめ指定された世界観や物語の筋(プロット)などの情報にしたがって文章を生成するものである。冒頭に掲げた小説「コンピュータが小説を書く日」の評で指摘した「物足りなさ」は、「コンピュータが書いた」ということではなく、その設計図に由来するものである。結局のところ、小説生成システムという「新たなペン」を握った作者(人間)によって書かれた作品であるというのがぼくの見解だ。

 このことは、「人間が用意した設計図にしたがって文章を生成しただけ」という言い方になるかもしれないが、実のところこの「だけ」が自然言語処理において大きな課題である。そして佐藤氏は「きまぐれ作家プロジェクト 作家ですのよ」に参加した目的は「小説の自動生成プログラムを作りたいから」という訳ではないことを著書のなかで最初に述べている。自然言語処理という領域において、佐藤氏は「1段落以上の意味の通る日本語の文章を機械的に作る」ことを一貫した研究課題として掲げており、「小説の出力」はその一例にすぎない。そしてこの課題のなかにも、「1段落以上」「意味の通る」「日本語」「機械的に」という文章生成における重要なキーワードが複数含まれていて、「日本語の小説の生成」は諸問題が複雑に絡み合った難問題であることを端的に示しているといえよう。

 

 自然言語処理は、無理を承知であえて一言でいうならば「文章の読み書き」に対応する学問だ。同書の佐藤氏の説明によれば、大きく分けて「解析系」「生成系」に分けられる。「解析系」では文章を読むことで語や文の構造的特徴などの情報を取り出す研究、「生成系」は特定の情報を与えることでテキストを出力する研究である。また入力の情報と出力の情報が等価であるケースでは「変換系」というものがあげられ、具体的には機械翻訳がこれに該当すると佐藤氏は述べた。これは「解析系」と「生成系」の中間的なものだと解釈することもできるだろう。

 話を戻すと、「解析系」は「読む(=テクストから情報を採取)」ことを、「生成系」は「書く(=何らかの『文法』にしたがってテクストを生成)」することにそれぞれ対応していて、両者は入力と出力が逆転したような構造を持っている。このような対称な構造を持っている場合それらの研究は相補的な関係を成しているケースが少なくない。「きまぐれ作家プロジェクト 作家ですのよ」はいうまでもなく「生成系」に類する研究になる。

 佐藤氏は同時に「ロボットは東大に入れるか(通称:東ロボ)」にも参加している。佐藤氏の担当は現代文であり、選択式の「センター試験」と、記述式の「東大二次試験」を解くシステムの開発も取り組んでいる。出題形式に応じて解法アルゴリズムを作る必要があり、たとえば傍線部解釈問題では、傍線部前後のテクストと選択肢のテクストの類似性を検討し、回答する。この類似性のチェックは「解析系」の研究にあたり、すなわち「読む」ことに繋がる。記述式問題の回答では、テクストを読み、その内容に類似したテクストの「生成」が必要になることを考慮すると、「読む」と「書く」は表裏一体の問題だと解釈することも可能だろう。

 そしてこの相補性は「小説の創作」についても同じだ。そこで最初に掲げた小説を書くためには、まず小説を読まなければならないという主張が浮上する。これは一般論として多くの実作者や編集者などによって繰り返し言及されてきたことだ。ある者はストーリーのパターンを多く知るために読めといい、ある者は文章表現の多様さを知るために読めといい、ある者は違う世界を広く知るために読めという。ひとによりその主張の詳細は異なるが、ほぼすべてにおいて共通するのは「小説をなす構造」に着眼しているということだ。いわゆるストーリーの起承転結や、巧みと評される文章の仕組み、空想の世界がリアリティをもつ所以など、それらを抽象次元で理解することで実作者はより高度で安定した実作を行うことが可能となる。事実として、「コンピュータが小説を書く日」では、「ストーリー文法」という物語の筋書き・構造を入力することで小説を出力する手法を採用している。奇しくも、「小説の自動生成プログラム」というペンについて紐解いていくと、それは人間が小説を書くプロセスで意識的にも無意識的にも行なっている過程が散見される。ぼくは個人的に「なぜ小説が書けてしまうのか」ということにおもしろみをかんじ、そして課題意識を持って実作を行なっているが、フィクションであれ学術研究であれ、その生成過程が具体的に検討できるということは、小説そのものが自然科学に含まれることに同義ではないか、と考えている。

 一部では「感情がどれだけ揺さぶられたか」や「人間らしさ」を文学のアイデンティティとされることもあるが、この連載では「小説の自動生成」を背景に、「小説=自然現象」として捉え直すことで、自然言語処理という学問や文学について考えてみたい。新たなペンを握ることで新たな発想が生まれるはずだと、ひとまずは信じたい。

 

人工知能は小説を読み書きできるか?:第2回『分散表現と「意味」』

人工知能は小説を読み書きできるか?:第3回『逆翻訳による「探索」と「深化」』

 

まちゃひこ

文筆家。京都大学大学院工学研究科博士課程で熱工学や統計力学の研究を行う。単位取得中退後、求人広告の代理店に勤務したのち独立。創作プロジェクト「大滝瓶太」を主宰し、2018年第1回阿波しらさぎ文学賞を受賞。同年10月中旬発売の文学ムック「たべるのがおそい Vol.6(書肆侃侃房)」に短編小説『誘い笑い』を寄稿。

Twitter:@macha_hiko

ブログ:カプリスのかたちをしたアラベスク