人工知能は小説を読み書きできるか?:第2回『分散表現と「意味」』(全3回)

人工知能は小説を読み書きできるか?:第1回『自然言語処理と新たなツール』 より続く

 

 不死なるものが地上に下りてきて、人間の身体をもらい、人間が死ぬように死んでいくという神話を、ヘレンはこれまでに嫌というほど聞いていた。ヘレンはこういう聖句をどう解釈すればいいか知っていた。もし神に人間の真似ができるなら、我々人間も同じことができるはずだ、と。そのプロットは心が産み出したものであり、自分に自分を説明する意識なのだ。物語としては古典的なページターナー、密室ミステリ、思考と雅歌、権力の回廊から閉め出され、事後承諾的民会をでっちあげて己の利用されている存在を解明しようとする、有権者の叫び。思考する器官は、自分のことを想像されている以上にはるかに得体の知れないものである。想像できる以上に。

──リチャード・パワーズ『ガラテイア2.2』(若島正 訳)

 

 前世紀、といえば大げさだがいまから23年前の1995年、アメリカの作家リチャード・パワーズによって発表された長編小説『ガラテイア2.2(GARATEA 2.2)』には、「人工知能が文学の修士号口頭試問をパスできるシステムの開発」というプロジェクトを中心に据えた物語がある。主人公リチャードは作者本人とも読め、自作についての言及も含む私小説的なエピソードがふんだんに語られながら、かれはアップデートを重ね「ヘレン」と呼ぶ人工知能にたくさんの文学を読み聞かせ、「彼女」にテキスト解釈を学ばせる。

 日本での「ロボットは東大に入れるか(通称:東ロボ)」プロジェクトについての話を聞いたとき、パワーズのこの小説を想起した。プロジェクトを主導した新井紀子氏の著書『AI VS. 教科書が読めない子どもたち』によれば、東ロボの目的は「AIにはどこまでのことができるようになって、どうしてもできないことは何かを解明すること」と述べられており、「現状のAI技術ではこれ以上の成績向上は見込めない」という理由から2016年にこのプロジェクトは凍結となった。

 この件で言及された「AI技術の限界」とは、「コンピュータが文章の意味を理解できない(=文章が読めない)」ということだ。コンピュータは統計として文章を読み込み、単語の出現パターンや文章構造などの情報を取り出しこそできるが、文脈やそもそもの単語の意味を特徴量として抽出することができない。それが「AI技術の限界」と考えるか「アルゴリズムの問題にすぎない」と考えるべきかは個々に意見が割れるところではあるが、そもそも「意味」や「理解」、そして「文章を読める」ということがいったいどういう現象なのかという問いを不可避的に生じさせている。

 

そこで「意味」を「絶対的意味」と「相対的意味」の2通りに分けて考えてみる。絶対的意味とは語句そのものが本質的に持っている意味を指し、「赤」や「青」といった色や、「暖かい」や「冷たい」といった感覚の言葉などを示す。そして「相対的意味」とは、文脈に沿って付与された意味であり、特定の語句の周辺情報に依存するものだとする。「コンピュータは文章が読めない」というのは前者の「絶対的意味」を認識できないということに該当する。

一方で、文章の使用パターンや構造的情報から相対的に語句の意味を数値ベクトルとして与える方法は存在し、Word2Vecなどに例があるように、自然言語処理において広く使用されている。多数の文章をコンピュータが「読む」ことにより語句を「学習」し、算出された数値ベクトルを元にして、語句の「足し算」や「引き算」(王様 ー 男性 + 女性 = 女王様)や類義語の推定を行うことも可能だ。この方法は類義語には強くても対義語には弱いなどの問題があるものの、「意味」という抽象をベクトル空間として表現することで何らかの描像を立ち上げようとしているという点におもしろさがある。

 

 そこで、文章が「特定の『意味』が特定の空間上に配置され、その連続的な運動を示しているもの」だと考える。すると、「文章を読めない」とはその描像を正しく立ち上げることができないということになる。この「意味の描像を立ち上げる」という作業は「文章を書く」ということとほとんど変わらない。「読む」という行為も、「書く」という行為も、「意味という抽象を具体化する」という点で共通していて、それをどこに投影するか──身体の内側か外側か──が異なっているだけにすぎない。

 AI技術の大きなキーワードとして「模倣(らしさ)」がある。たとえばディープラーニングでは、出力の「もっともらしさ」は教師としたデータにどれほど「似ているか」を数値化したもので評価されるが、その数学的な仕組みじたいが「脳を模倣したもの」で、時代を遡ればチューリングテスト(イミテーションゲーム)は「人間らしいふるまい」を論点としている。「小説を書くために小説を読む」というのは、小説を読むことにより「小説らしさ」なる特徴量を抽出し、「小説らしい文章群を書く」ことができるようになるということに思えるが、それだけではない。小説には文や小段落といった比較的ミクロな構造と、起承転結や叙述トリックなどの比較的マクロな構造がある。小説らしさなる特徴量を抽出するのはそれらを学習することだが、それだけでは小説の部品を取り揃えた(文生成における辞書をインストールした)に過ぎず、空間上に配置された「意味の運動」をとらえたことにはならない。
 構造的特徴は静的な情報であり、小説を大きな一枚の絵として認識したときに立ち現れるものだ。これのみに終始すると、実作において重要な「意味の動的性質」を掴めない。これは分子シミュレーションを実行しようとして、運動方程式が不在なのとおなじだ。

「読む」という行為は、言語によって張られた空間上での「意味の運動」を実際に経験し、過渡現象として小説を認識する訓練として重要だ。設計図を最初につくり、それに忠実に文章を書き起こしていくタイプの書き手もいるが、書きながら考え、書くことにより設計図が随時更新されるタイプの書き手も少なくない。「登場人物がひとりでに動き出した」などの比較的よくいわれる実作でおこる現象は、小説のミクロな部分を支えている動的性質によるものだとぼくは考えている。

 この動的性質が顕著に現れた作品のひとつに、フランツ・カフカ『変身』が挙げられる。この小説では、主人公グレゴール・ザムザが目覚めると虫になっていたという極めて不安定な状態から始まり、ザムザや家族の動きが時系列に沿って展開され、最終的にはザムザの死という平衡状態に達する。マクロには三幕構造という基本的な構造が使用されているが、瞬間瞬間のシチュエーションとそこに配置された登場人物の挙動を推進力としており、マクロな構造はあらかじめ想定していたというよりも、その集積として自己組織化されたような印象を受ける。あたかも非平衡分子シミュレーションを見ているようだ。

 こうした文章の動的性質について、冒頭で引用した『ガラテイア2.2』についてパワーズは以下のように言及している。

 

パワーズ 『ガラテア』を書いていて楽しかったことの一つは、機械じかけの知性にも、人間と同じだけの幅広い経験が必要になる、ということが徐々に見えてきたことです。作品の最後にさしかかると、作品自体が、ある種の人工知能になってきます。作品に登場する「ガラテア2.0」は、読者が読んでいた、改訂版の2.2にとってかわられます。読者がこのおはなしを信じるためには「どのようなフィクションも読むことのできる、神経細胞のようなネットワーク」が存在することをひとまず信じる必要がありますが、そういう判断を保留して読者は、より大きなスケールで自己省察する機会を得ます。つまり、百科事典のように濃密な、自分自身の人生を通じてでなければ、今読んだこの本の意味など、決してわかるはずもなかった、ということがわかるようになるのです。

──柴田元幸編集『パワーズ・ブック』

 

 この小説では、書き手の「書く」という行為と読者の「読む」という行為が等価なものとして機能している。この性質が顕著に現れているのが『ガラテイア2.2』という小説の特質であると同時に、小説を読み、解釈し、意味を見出すことが、「小説を生成する」ことに等しいという可能性を示唆している。小説を書くのと同様に、小説を読むためにも膨大な知識や経験を必要とする。意味やことばは動く。目の前の散文を「小説」と呼ぶためにも、その動的性質を捉える訓練が必要だろう。

 

人工知能は小説を読み書きできるか?:第1回『自然言語処理と新たなツール』

人工知能は小説を読み書きできるか?:第3回『逆翻訳による「探索」と「深化」』

 

まちゃひこ

文筆家。京都大学大学院工学研究科博士課程で熱工学や統計力学の研究を行う。単位取得中退後、求人広告の代理店に勤務したのち独立。創作プロジェクト「大滝瓶太」を主宰し、2018年第1回阿波しらさぎ文学賞を受賞。同年10月中旬発売の文学ムック「たべるのがおそい Vol.6(書肆侃侃房)」に短編小説『誘い笑い』を寄稿。

Twitter:@macha_hiko

ブログ:カプリスのかたちをしたアラベスク