AIが勝手に書いた「1148字」の衝撃の中身

世界の終わりがやってきてもおかしくない――。冒頭から終末予言のようなフレーズが登場。AIはどのようにしてこの文章を自動生成したのか、仕組みについて坂本教授に聞いた。

坂本真樹●電気通信大学大学院 情報理工学研究科 情報学専攻教授 東京大学大学院総合文化研究科言語情報科学専攻博士課程修了。言葉と感性の結びつきに着目した文系的な現象を、理工系的観点から分析し、人工知能に搭載することが得意。

「まず、いただいた『プレジデント』の1年分の記事のテキストデータをAIに“理解”させます。AI、つまり機械にとって文章はただの文字の羅列です。例えば、『ターゲット』という言葉は『タ』『ー』『ゲ』『ッ』『ト』。これを、『ターゲット』という意味のまとまりで区切るために、形態素解析(最小の単語単位に分解すること)をします。形態素解析は、AIに“言葉の辞書”を渡す作業とも言えます」

文字の羅列を言葉として理解したAI。次は文章作成かと思いきや、その前に文章の構造を「学習」させる必要があるという。

「人間も赤ちゃんにいきなり記事を書けと言っても無理ですよね? それと同じことです。AIに『プレジデント』の文章の特徴とルールを学習させるんです。AIに学習させる手法として今ホットなのはディープラーニングという4層以上のニューラルネットワーク(人間の神経回路網を人工ニューロンという数式的なモデルで表現したもの)なのですが、それが扱うのは10万記事くらいの大量のデータ。今回はデータ量が少なかったので、2層のニューラルネットワークを組み、いわゆる『教師あり学習』を行いました」

教師あり学習とは、機械に例題と正解のデータをペアで与えて、データの特徴やルールを学習させる機械学習のこと。AIが『プレジデント』の記事の特徴を学んだところで、いよいよ文章作成だ。まず、学んだ記事の中から“文章の材料”を抽出する。