生物学の知識や技術を援用した作品群を始めとした科学的なアプローチで表現活動を行う石橋友也さんと、データ・サイエンティスト/エンジニアである新倉健人さん。共に広告会社に勤務し、石橋さんはウェブやテクノロジー関連の企画・制作、新倉さんはデータを用いたマーケティング業務に従事しています。今回採択された企画は、人間によってSNS上に日々生み出される「トレンドワード」(*1)を素材に、AI(人工知能)が俳句や詩を創造するという、広告やウェブというメディアの現在を意識した試みです。

アドバイザーを担当するのは、ソニー株式会社勝本常務室UX企画部コンテンツ開発課統括課長の戸村朝子氏と、アニメーション作家/東京造形大学准教授の和田敏克氏です。

*1 トレンドワード……ウェブ上で検索数や発話数が急上昇している今現在関心を集めている言葉のこと。

テーマの再確認と生成実験

―進捗状況をまとめた資料を見ながら面談を進めます。

石橋友也(以下、石橋):採択後、まず今回のプロジェクトのテーマを再確認しました。発想の原点は、Googleが行ったAIについての研究論文です。そこにはAIが膨大な書籍データを学習してつくった短い詩(原文は英語)が掲載されていました。機械の無機質さとしっとりとした詩という、異なる雰囲気の同居に惹かれたのです。
その研究で詩の素材としたのは書籍データですが、今回の企画ではSNS上のトレンドワードを用います。「時代の言葉×機械の言葉」をブレないテーマとして、トレンドワードをもとにAIが今日(こんにち)の詩をつくる。すぐに忘れ去られるような言葉を用いて、機械がぎこちなく詩を綴ることで、そこに意外な発見や詩情、違和感を発生させることを目的に進めたいと思っています。

新倉健人(以下、新倉):AI開発の進捗状況としては、Twitterのトレンドワードを用いた俳句の生成実験をしながら、そのアウトプットイメージの確認、検討を行なっています。試しに、今日のTwitterのトレンドワードで実際に俳句を生成してみたいと思います。
例えば「#大坂なおみ帰国会見」と「#サマータイム導入」でやってみると……。

「周遅れ サマータイムの 権力を」
「放送で 大坂なおみ 見地から」などAIによって生成された俳句が並びます。

新倉:このように、ツイートに含まれる単語を分解し、5音、7音になる語、あるいは助詞と組み合わせてその数になる語をランダムに掛け合わせて句を生成します。できた中から使えるものをピックアップしてみると、今のところ5〜10%程度です。意味が通るものや語感がいいもの、発見性のあるもの、カタカナ語やオノマトペに硬い印象の日本語(漢字)が組み合わさっているものなどがいいなと思っています。
素材となるハッシュタグは一つよりも二つ使った方が、意外性があり意味深な句ができました。俳句の世界では、一つの句に二つの事物を取り合わせることで生まれる相乗効果を「二物衝撃(にぶつしょうげき)」と言うそうです。広告の制作でも似たような手法を学ぶので、自分たちが用いる手法としてもしっくりきました。
ただ、俳句の形式そのままだと見慣れすぎていて、新鮮味にかけるような気もしています。5音、7音の語を並べるというベースは変えず、不定形の自由詩も視野に入れてより魅力的なものができる割合が高いものにしようと思っています。加えて、素材がSNS由来のトレンドワードのみだと、当初求めていたしっとりとした静謐な質感の詩に至らないことがわかりました。あらかじめ深層学習を用いて、詩などの日本語を学習させたAIに、トレンドワードを与えるということも考えています。

和田敏克(以下、和田):助詞、助動詞の扱いが難しそうですが、どのようにコントロールしているのですか?

石橋:そこが日本語ならではの難しさで、微妙なニュアンスはAIに学習させられません。それよりも、この助詞は一つの文章に一つまで、など、アナログなルール設定を施してコントロールするやり方を探っています。

戸村朝子(以下、戸村):助詞の問題は、一度英訳してから日本語に直すなどすれば解決するかもしれませんね。

石橋:それは良い方法ですね。ただ、助詞のぎこちなさは、機械らしさやおかしみを含ませてくれる要素でもあるので、いいバグ具合を探りたいと思っています。あとは、助詞なしで学習させることも試していて、それは比較的成功しています。

生成プロセスを見せるアウトプット

―生成の様子を可視化したアニメーションの実験を見ます。

石橋:実際にアウトプットイメージの制作を開始できるのは詩の形式や生成方法が決まってからなのですが、仮に自由詩の形式で試作しています。AIの頭の中を覗くというコンセプトの、詩の生成プロセスを可視化したようなアニメーションです。画面に並んでいるのはトレンドワードに関連するワードです。その中から、詩の最初と最後に入れる語がそれぞれ選ばれ、AIがその間の数行を生成してつなぎます。全体で5秒から10秒程度のイメージです。

戸村:最初と最後の1行に入る語を選ぶのは人ですか?それともAIでしょうか?

石橋:今のところはAIによって完全自動化したいと考えていますが、何か意味を見いだせれば、インタラクティブにしてもいいと思っています。その場合は、人が語を選んでから詩が生成されるまで1分程度かかると思います。

戸村:完全に機械が生んだものと、人が恣意的に選んだもの、比較に意味があれば両方を見せるというプレゼンテーションの仕方も良いでしょう。

和田:きっとやりたくなる人いますよね。これとこれ組み合わせたらどうなるだろうって。

作品を通して浮かび上がらせたいもの

 戸村:俳句の実験で、生成された中で使えそうなものは5〜10%程度とのことでしたが、どれくらいディスラプト(破壊、崩壊)して良いかなど、その許容範囲や線引きは感覚的なものでしょうか。個人的には多少ディスラプトしているものがあってもいいと思います。

新倉:フォロワーのツイートを学習し、分解して組み合わせ、ツイートする「しゅうまい君」というアカウントがありますが、あれはややディスラプトしすぎている気がします。最終的には、やはり、3回に1回くらいはそこそこのものが生成されるようにしたいところです。インタラクティブにするなら尚更ですね。

戸村:プロジェクトを通して何を浮かび上がらせたいのかがより重要だと思います。AIも人間に匹敵する創造性を持つことを伝えたいのか、それとも詩で見る人を感動させたいのか。前者のAIのクリエイティビティの向上をメインに扱うことを重視するならそれでもいいと思いますが、エンジニアリングの側面がより大きくなると思います。テーマをお聞きした感じでは、必ずしもそうではない気がするのですが、機械が生み出す過程に見えるおかしみや、余韻のようなものを作品にしたいのではないでしょうか。

石橋:僕自身は重要なのは後者だと考えています。ただ、そのおかしみや余韻を感じられるラインを探ることにも、かなりのエンジニアリングが必要だなというのが現状の感想です。僕たちはアーティストとエンジニアなので、二人の中でもその捉え方には差があるかもしれません。

新倉:生成過程や出来上がったものによって、新しいものの見方を提示したいというのが根本にあります。人間活動を材料に機械がクリエイションするという転倒に面白みを感じますし、その奇妙さや違和感、怖いくらいの雰囲気を出せたらと思っています。人間が思いつかないような、発見感のあるものを生成することが理想です。

戸村:完全自動化するにせよ、インタラクティブにするにせよ、先ほどのアニメーションのように、生成された結果だけでなくそのプロセスも対になって見られることが重要だと思います。生成された詩のクオリティよりも、どのようにその詩が生成されたかを見せること。プレゼンテーションの形として価値があるのはそこではないでしょうか。その無人のはずの過程に、「第三の匿名のクリエイターがいる!」と思えるようなものが見たいですね。

和田:俳句だけだと正直ピンときていなかったのですが、今日のアニメーションはすごく面白かったです。僕も、詩がつくられていくプロセスが肝だと思います。それを見て、理解しながら楽しむ作品だと思います。生成過程で出てくる単語の時点で、すでにドラマを感じるし、それがさらに詩になる過程は魅力的です。多少ぎこちなくても文学的なものは十分受け取ることができると思います。

―次回の面談では、詩の形式の決定に至るための、さらなるシステム開発、生成実験の進捗が報告される予定です。