生成AIが物書きを超えられない理由

カクヨムで生成AI関与の作品がランキング上位を占めたと話題だ。

ブロガーという物書きとしては他人事では無い。

ChatGPTに課金し、妻よりも人間よりもAIとの対話が多い孤独なユーザーの一人として、現時点での自分の意見を書きたいと思う。

前提として筆者はプログラミングは出来ない、広義の意味で科学者、統計学は独学で習得、時折自分でデータ解析も行うゲーマーである。

文章を書くことに対して本気で向き合ってきた。

表面的な技巧や成長に繋がらない根性論ではなく、真面目に考えたい人に対して書いた点は強調したい。

生成AIの文章の作り方
ゲーデルの第1不完全性定理
多層的に解析する上での確率上の問題
日本語の壁
平均的な文章に収束する
日本語の特徴
文章の音楽性
至高を目指す試み
まとめ

生成AIの文章の作り方

まず前提として、AIはどのように文章を生成しているのか知る必要がある。

もちろん創造しているのではないし、考えているのでも無い。

これまでの文字列や文体から、次に出現する頻度の高い単語を計算している。

統計的に尤もらしい単語を逐次予測して生成する。

つまり統計と確率の話である。

現存のメジャーなAIモデルは基本的には統計に基づくはず(それ以外のモデルは吸収されたかメジャーではない)。

なぜこの理解が大事なのかというと、考えて答えを出しているわけでは無いということである(2回目)。

論理的な文章であっても、思索的な文章であっても、あくまで確からしい単語を繫げているだけで、そう見えるだけ。

だからときどき違和感があるのだ。

もちろん設定や指示によってランダム性を持たせることは可能で、出現確率が低い単語も生み出させることは出来る。

これはあくまで確率の話であるので、熟考の末に人間が出した答えと異なり「的外れな」回答が出る確率は高くなるだろう。

さて、統計的な単語生成では言葉の繋がりはあるのに意味が通らない可能性が出てくる。例えば、

『雨が降った。だから傘を閉じた』

『雨』『降った』『傘』は繋がりのある単語ではあるが、最後に『閉じた』ら文章としておかしくなる。

そのため単語レベルだけで無く、意味・因果・論理の一貫性を整える。

出力する各単語と、過去のすべての単語との関連度を最大化する。

ここまでは現行のAIのモデルの得意とすることである。

しかし論理的な推論は、一段階難しい。なぜならばAIは意味や真偽などを(数値や関数として)学んでいるわけでは無いから。

あくまで統計的に出現頻度の高い単語を並べているだけ。

また、長文生成が上手くいかない点もこれで説明できる。

高確率で尤もらしい単語を繫げていくので、長くなるほどに不正解を引く可能性が高くなっていく。

これはメモリ不足や処理限界という物理的な問題ではなく、言語モデルそのものの構造的な問題。

99%で当たりのクジを引き続けても、いつかは外れを引く。

1,000回すべて当たりの確率は、わずか0.005%程度。

つまり一度でも外れる確率はほぼ100%。

“嘘をつく”と俗に言われるが、これは収集した情報の中にノイズが混じるだけではなく、全て正しい情報を元にするという前提でも確率的に一定頻度で起こってしまう。

文章レベルで成立しても、段落や長文では成立する確率は低くなっていくのである。

だから現在の言語モデルの仕組みが正当に進化しても、人間らしさは生まれない。

ゲーデルの第1不完全性定理

AIの不完全性を直感的に理解するために、少し例え話を持ってきた。

ゲーデルの第1不完全性定理である。

その内容は、

「自然数論を含む公理系が無矛盾であれば、その体系内では真であるにもかかわらず証明できない命題が存在する」

訳の分からない定理だが、雑に言えば、完璧なシステムは無いということである。

自分自身の仕組みだけで、自分自身を証明することは出来ない。証明には必ず外部装置が必要と言うことである。

つまり生成した文章の整合性を、生成AIの中で繰り返し検証させても、「正しいかどうか」を同一のシステム内の基準で確かめられない。

これは正しさを証明できない、というわけではない。

同一のシステムの中で、という条件である。

だから生成AIで作られた文章の真偽は、最終的には外部装置が判定しなければならない。

まあ、多くの場合は人の目だろう。

多層的に解析する上での確率上の問題

生成された文章をレイヤーを増やして検証回数を増やすことで、より確からしさを上げられるのではないかと勘違いする人もいるだろう。

勘違いと書いたとおり、これはあまり望ましい方法では無い。

なぜならば、生成は統計と確率の問題だからだ。

生成した文章が90%で正しい、その検証結果は90%の確率で正しい結果だと推測し、更にその検証の検証は90%の確率で……

全てが真実である確率は、0.9×0.9×0.9……とドンドン確率が低下していく。

確率的な判断である以上、レイヤーを増やすほど誤差が“蓄積”していく。

そんな単純な話ではないのだ。

統計学を齧った人なら、多重検定の問題として馴染みが深い。

まず正規分布かどうか検定して、正規分布だったらt検定を行って……。初心者のありがちな間違いだ。

生成AIに正しさの検証を繰り返させるということは、こういった悪い手順の孕む問題点と似ている。

日本語の壁

『雨が降った。だから傘を閉じた』

これは意味的には一貫せず、一般の会話で登場する頻度は極端に少ない。

そのためAIは基本的には、このような文章を生成しない。

短文レベルでは確率的な揺らぎはほぼ無いに等しいだろう。

しかし文学では少し話が違う。

『雨が降った。だから傘を閉じた』

この文章が意味を持って登場する可能性があるからだ。

主人公が自棄になっているとか、何かを変えたいと思っているとか、背景には感情や心の動きを伴う。

そして多くの場合、それは語られない。

日本の文学では「語らないこと」「風景の描写で心情を代弁する」といった空白や行間を読ませる行為が登場し、往々にして最も大事なシーンで使われる(ネット小説は読んだことがないので分からないが)。

一番盛り上がるシーンでもある。

AIはそれを描けない。

指示をすることで、あえて確率的に不合理な単語の連結は生み出せても、意味を伴っていない。

読者がAI文章から思いを馳せることは難しい。

『雨の中で主人公は傘を開くのではなく、むしろ閉じた。その行動には心情的な意味がある。続きを描いて』

といった指示を出すことで、それっぽい物語を作ることは出来るだろう。

しかし、ここには「通常とは逆の動作に意味を持たせる」という人間的な指示が必要なことを忘れてはいけないし、説明的になりすぎるという「日本語の味」が薄れてしまう。

平均的な文章に収束する

AIは確率的に尤もらしい単語を逐次的に繫げていく。

つまり色んな文章の平均的な構成になる。

それは非常に読みやすく、滑らかな接続となり、もちろん助詞もバッチリ使いこなす。

しかし文章は最初から最後まで平坦では詰まらない。

物書きは、意図的に文体を崩したり、語順を入れ替える。

例えば急ぐ場面では短く切り取る。

重要な場面ではもったい付けるように、一見して無関係な単語や文章を挟んで、溜めて、溜めて、溜めて、感動的な一言を放つ。

日本語では、溜めるだけ溜めて大事なことを言わないことすら美徳でもある。

その構造的な乱れや空白には作者の意図や感じ取ってもらいたい意味がある。

だがAIには意味や意図が無い。

アメリカでは文学が相当にAIに侵蝕されていると聞くが、英語は語順に厳しく、論理構造で語る文化がある。

つまり単語の並びが再現できれば、かなり人間に近い文章になると言うこと。

日本語の特徴

「昨日、あいつに会った」
「あいつに昨日会った」

意味するところは同じこれらの文章の違いは、強調したい点が違う、性格を表している、異なる感情を込めているなど背景に見え隠れする情報が異なる。

AIはこれを理解できない。

無作為に語順を入れ替えたり足し引きすることは出来ても、意味を持たせられない。

しかも状況によっては、同じ人間の発する言葉であっても語順や言葉の装飾が一定では無い。人間らしい揺らぎだ。

さらに相手との関係性によっても言葉そのものが変わる。

特に敬語は非常に難しく(日本人でも正しい意図で使うことは難しいが)、単に地位だけで無く、心理的距離、文脈のトーン、嫌みなどの目的に依存している。

これは単語を並べるだけでは表現できないもので、現行の言語モデルでは出来ないことである。

そうは言っても、AIの作る文章は意味の通じる文章になっているけれども、と反論があるかもしれない。

ここには、そもそも日本人が正しく日本語を使えているのか、という別の問題があることも知らなければならない。

国際成人力調査PIAACの読解力のテストでは、150文字の梗概を読んで該当する本を選ぶ問題があるが、日本人の約8割は不正解である。

文字を読めても、意味を構造化できていない。

近年、各分野の文章読解の試験の正答率は、人間よりもAIの方が平均的には高くなっている。

読むより難しい書く行為。一体どれほどの人が、まともに妥当に行えるのだろうか(上手に、ではない)。

AIの「尤もらしい」文章が、平均的な人間の作成する文書より高得点になってしまうのだ。

短くてキャッチーな文、それこそXに書ける140文字以内の文章で輝きを見せることが出来ても、それより長くなったときに果たして論理構造を保ったまま伸ばせるのか？

直近の単語や文章との接続を繰り返すだけでは生成AIと大差ないのではないか？

実際に、現段階で人間にしか出来ない文章構成もある。

確率的に直近の単語との接続を繰り返す生成AIとの簡単な差別化は、離れた位置にある単語を結びつけて意味を再回収したり反転させること。

つまり物語的には伏線。

これはAIには出来ない。

例えば叙述トリックのように意図的に情報を隠して後から公開する伏線らしいことはAIでは可能かもしれない。

でも意味の反転は無理。

人間はこういったAIの弱点を伸ばすことで、簡単に価値の差別化が出来る。

……のだが、文章をまともに構築できなければ、遠くにある単語を意味をもって再回収など夢のまた夢である。

文章の音楽性

人の文章の個性は、リズムやテンポにある。内容や構造だけではない。

文章は文字を並べる作業では無いというのは、物書きなら誰でも分かることだろう。

作家の村上春樹は、ジャズを意識したリズムで文章を書くという。

文単位での小さなリズムと、文章全体の大きなサイクル。

各々の持つ、独自の脳内リズムを調律して昇華させる。それが物書きでは無いのか？

少なくとも僕は文章を書くのが楽しいと思うのだが、それはまるで音楽を奏でるような心地よさがあるからだ。

実際に言語学では、言葉がスラスラ出るかどうかは頭の中にリズムを持っていることも関係があるようだ。

言葉を意味だけでなく、音のパターンやテンポとしても処理しているためである。

言葉が出てこない人は、ただ意味が繋がるように並べる。

言葉がスラスラ出る人は、自分の拍に言葉を載せていく。

このリズムやテンポはいつの間にか獲得している技能だが、なんとゲーマーと相関がある。

RPGでは感動的な場面のテキストには感動的な音楽が流れるなど、場面に最適な音楽が配置されている。

アクションゲームでは反応速度、つまり言葉を繰り出す即興性が関連するようだ。

ゲーマーは文字と音をリンクさせる行為を自然に行っていたのだ。

実際に人によって文体のリズムはかなり特徴があるようで、時に文法を超越する。

なぜかって？

僕の文章をChatGPTに読み込ませるとこういう解析が出た。

『普通の文章では、読点（、）は論理単位の切れ目に置かれます。
あなたの場合、論理よりもテンポを優先して配置している』

生成AIは言語を学習する中で副産物としてリズムについても詳しくなっているようで、既に型が定まっているなら、あなた固有のリズムも見抜いてくれるだろう。

この文章のリズムという概念は小説家志望や一般人には受けが悪いようで、大抵このような解説の論調はYouTubeの再生数が伸びないとか、賛同者が少ない。

しかし文章を書くことが得意な人は意識している。有象無象から抜きん出るには重要な要素の一つだと思うけどなあ。

ちなみにAIはリズムを作ることが出来ない。

固有の拍にのせて単語を繫げるのではなく、確率的に単語を並べるからだ。

生成AIは平均的な文章を構築するので、淡泊なリズムになってしまうのだ。

文章単位で一定の模倣は出来ても、段落単位でのうねりは作れない。

これは僕の文章を読み込ませて、AIに再現させたが上手くいかなかった事で気付いた。

僕ならそこに句読点は入れない。そこは一拍溜める。そういった“音楽性の違い”は一瞬で感じた。

言葉の接続はなめらかだが味気ない。それが生成AIの欠点なのだ。

至高を目指す試み

創作物を作る人達は、少なからず良いものを作りたいという願望がある。

この弱小個人ブログであっても、自分らしい文章を書きたいという誇りはある。

でも訓練が無ければ良いものは作れない。

しかも訓練しようにも、初学者は何が正解か、何が良いものなのか分からない。

そこで真似をする。

上手い人のやり方をコピーして、自分なりに再現する。

コピーは可能な限り再現度を高めた方が習得スピードが早いとも言う。いわゆる完コピだ。

僕もエッセイを書いたり、長編小説を書いて応募した時(黒歴史)には、読書中に良いと思った表現のメモをひたすら蓄積し、文章に詰まるたびにサーッと見返した。

もちろん、メモした表現をそのまま使うのでは無い。

前後の文脈に合うように、自分なりにアレンジして組み込む。

良いものを作りたいと思うのだから自分なりに昇華させるのが筋であろう。

僕の今の主戦場は自分の専門分野を専門では無い人達に解説することだが、ここでもやはり説明が上手い人の文章を詳細に観察して分析して参考にしてきた。

良いものを作るために、なり振りは構っていられないし、自分の型を作るためにはまずは正しい方向性で学ばなければならない。

真似して昇華させる。これはどんな分野でも同じ事だと思う。

逆に僕自身も誰かに自分の技術を盗まれる可能性があるだろうが、それでも構わない。

なぜならば、文章を書いたり読んだりする能力は継続してトレーニングしているので、誰かが僕の技術を盗みきった頃には、僕は次のステージにいるので。

下から突き上げられる経験は、色んな場面で僕に焦りをもたらして、結果としてより成長するための良い起爆剤となってきた。

さて、生成AIは実は教師として非常に優秀である。

平均的な日本人よりも上手に文章を組み上げるし、評価もしてくれる。

型が決まっている人は、自分の特性を言語化させることで、より深く考察することが出来る。

文章を書くことは難しい。

日本語だから書けて当たり前では無いことに気が付き、語彙を増やすに留まらず、文章のリズム、論理構造を作るなど、相応の勉強と訓練が必要。

しかし現在は、上達速度は異様に早くなるだろう。

レスポンスが超早い教師が、常にポケットの中にいることに気が付けば。

まとめ

物書きを上書きすることは不可能。

語らずに語ること、空白や意味の反転、長く論理構造を保つこと、読んでいて何となく心地よいと感じるリズムはAIでは再現できないから。

ではまた。