LWのサイゼリヤ

ミラノ風ドリア300円

18/2/5 のらきゃっと入門の感想

のらきゃっと入門、あるいはサイバーパンク時代の精神分析

この記事にとても感心したので思ったことを書く。
普段は事前知識が必要な文章は書かないことにしているのだが、今回は解説しているとそれだけで記事がいくつか出来てしまうこと、必要な知識はかなり常識寄りというか複数の本に書いてある一般論なので、各自で補完できるだろうということで説明抜きで許してほしい。

俺が一番「おおお!」と思ったポイントは、少なくとも外部から見る限りにおいて、のらきゃっとが行う誤認識による言葉のスリップが精神分析的な無意識による言葉のスリップを模倣するというところで、言われてみれば明らかなのに全く気付かなかった。言葉の音声に由来した原因によって単語を微妙に指し誤るという事態が言い間違い以外に存在して、それがバーチューバーという特異なコンテンツを介したという奇跡的な噛み合わせの発見は衝撃に値する。
noracat[1]
無意識に由来する「言い間違い」の精神分析の原理に対応して、音声認識ソフトの「言い間違い」について理系の立場から少し解説しておきたい。もちろん全く違う現象がたまたま似たように見えているという以上のものではないのだが、機械学習が原理上持つある種の不透明さを踏まえれば、この二つは天と地ほど異なるものでもない。

音声認識とは、入力音声情報に何らかの演算を加えて単語ないし文章を得るというもので、そこで行う演算は概ね「思考」と同一のものと考えてよい。日常的にも、何か情報を受け取って思考することで求める情報に変換するという作業はよく行われている(例:冷蔵庫の中身を見る→買い物リストを作成する)。
ここで機械が行う思考、すなわち演算はなるべく正しく動作するように作られてはいるのだが、もちろんこの世のあらゆる変換情報を正しく表現できているわけでもなく、たまには間違った結果を出してしまう(もっとも、これは入力側に責任があることも多い。ミミズがのたうったような文字を機械に読ませたらうまく読めなかったとして、どう考えてもその責任の半分くらいは字がヘタクソなやつの方にもあるのだが、機械は文句を言わないので「機械が推論を誤った」と判断されがちなところがある)。

入力と出力を結ぶ演算は、最も古典的には「この数値パターンはこの結果に対応するようだぞ」というように勘と経験によって人間が設定してきたが、機械学習分野ではマシンが自動的に生成する手法が研究されている。つまり、人間の代わりに機械が数値を見てパターンを勝手に学習するわけだ。
このとき最も重要なのは、機械が学習に際して人間からはもはや理解できない思考を行うことがよくあるということ。変にSFチックに捉えてほしくないのでもう少し正しく書くと、「機械が編み出した計算パターンが実世界においてどういう思考に対応するものであるのか解読できない」という事態がよく発生するということだ。思考を演算に変換することに比べて演算を思考に変換するのは容易ではないし、機械は数万数億という演算の組み合わせを平気で提出してくるため、「この計算は人間でいうところの○○という思考を表現しているのだ」などといちいち解釈することはとてもできない。

結局、機械学習によって「具体的にどう動いているのかは不明だが、概ねうまくいく思考のようなもの」が出現し、それを運用に回せば「意図や過程が明確には伺い知れない微妙な誤り」もよく発生する。一般的に思われている機械のイメージは理路整然とロジックを並べる冷静なマシーンかもしれないが、とりわけ機械学習分野においては意味不明な数値や計算式の群れを何億個も投げつけてきて何を言っているのかさっぱりわからない(けど正しいことをする)というマシーンが多い。

それで何を言いたかったのかといえば、「なんだか微妙に関連のありそうなことがよくわからん形で結び付いている」という意味で、機械学習済み推論プログラムと人間の無意識とはそう全く遠いものでもない。もう少しオシャレな言い方をすれば、人間にとって存在の代理物が言葉なのだとすれば機械にとっては数字が存在の代理物であって、人間が象徴界でスリップしているときに機械もまた計算グラフ上でスリップしている。
とはいえ、異なる現実界の認識機構を持つ二種類の認識主体による同一のスリップ現象と言うのは、まあ、話としては面白いかもしれないが、理論の適用限界を明確に超えているので流石に言い過ぎている。かろうじて言えることとしては、結果的に模倣のように見えるほど似通ってくることは原理的に有り得ない話でもないということくらいだろう(そもそも、のらきゃっとが使用している音声認識ソフトが何なのかも知らないのだが)。
DSicxgaUQAEG9VT[1]
脱線が行き過ぎたので、元の話に戻ろう。
のらきゃっとが言葉のスリップによって無意識=抑圧された衝動の住処の存在を示唆したとして、次に浮上してくる問題はそれが誰の所有物なのかということだ。もちろんここで言う無意識は類推されたハリボテでしかなく、厳密には誰のものでもないが、「ユニコーンは何本足か?」と同じレベルの架空の事物を巡る言明として、認識論的な次元でこれを検討する必要は残る。
先の記事では無意識のありかを患者(のらきゃっと)と分析家(リスナー)の間に横たわるセッション的な言語体系に求めているが、俺はもう少しキャラクターに寄せた場所に定位してもよいような気がする。つまり、無意識をほのめかすことでのらきゃっとが欲望する主体としての幻影を立ち上がらせるという実に単純な見方の方がしっくり来るように思えてしまうのである。
のらきゃっとがもう少し発達段階の早い幼児的なキャラクターだとしたら視聴者は彼女に法を与える父的な主体として振舞えたかもしれないが、それと言うには少し精神年齢が行き過ぎている。のらきゃっとは疑似的な無意識を提示することによって既に去勢され象徴界に参入した欲望できる主体に、リスナーにとっては同じ象徴界である程度確立された他者として欲望される存在になるという見方はできないだろうか。それならば、リスナーがのらきゃっとに欲望されることを欲望するという、オタクコンテンツが志向してきた擬似恋愛の究極とも言うべき関係がのらきゃっととリスナーの間に出現することになる。

ここで問題になるのは、記事でも指摘されている通りスリップのアドホックさだろう。
一度整理しておくと、ここまでに述べている精神分析的無意識には二通りの意味があり、一つは誰しもが持つものとして理論に組み込まれている一般名詞としての無意識、もう一つは個人ごとに存在して個別的なトラウマに対応している固有名詞としての無意識である(念のために言うと、前者の無意識はユングの言う普遍的無意識ではない。一般名詞であるとは共有されているという意味ではなく、個別に存在するものの総称という意味である)。
前者の存在が示唆されていることを理由にただちに後者の存在を導くのが飛躍ということは明らかである。のらきゃっとのスリップは無意識ではなく音声認識の失敗によって生成される一回性のものであり、個人が人生史上で抱えているトラウマを反映できないからだ。よって、先に述べたようにスリップを根拠にしてのらきゃっとが主体性を獲得するまでには、ライブごとに消滅しない無意識、すなわち無意識の時間継起性を確保しなければならない。これには二つの方法が考えられる。

まず一つには、恐らくは発音の癖や音声認識ソフトの仕様によって、スリップにはある程度の規則性が認められるということ。
頻出する誤認識例はニコニコ大百科などにまとめられており、sがtに変換されるパターンが多いほか(恐らくs音の滑舌が弱い)、何度言っても誤認識されてしまう単語を繰り返し訴える場面も多い。これらのパターンを多いと見るか少ないかと見るかという定量的な議論は避けるにせよ、少なくとも「ランダム生成としか考えられない」というほど無秩序に生成しているわけではない。それによってのらきゃっとが如何なる現実界(トラウマ)を抱えていると読み込むのかはともかく、何かしらの言語化されていない個人的領域の継続的な存在を示唆すると見なすことは十分に可能だと考える。

もう一つには、彼女がキャラであるということ。
無意識の時間継起性を如何にして確保するべきかという問いに関して、キャラの時間継起性に関する議論をそのまま流用したい。というのは、人生や内面を持つ登場人物的なキャラクター以前のものとして、目と鼻と口だけの単純な図像が何故か生命感を持ってしまうという状態をプロトキャラクター態と呼び、この生命感がマンガのコマを跨いだキャラの時間継起性を担保している(違うコマに描かれたキャラを同じ生命体だとみなせる)という議論である。
この効力はのらきゃっとのような萌えキャラでとりわけ顕著になる。萌えの起源はプロトキャラクター態の強度に存在する……という主張をそのまま受け取ってよいかどうかはともかくとして、のらきゃっとが魅力的な図像を伴っているという時点で、ある程度の時間継起性は既に保障されると俺は考える(感じると言う方が正確か)。

とりわけキャラの強度に関して図像が持つウェイトという点に関しては、バーチューバーの中でものらきゃっとだけが突出した立ち位置にいる。ルフィや悟空に近いレベルでキャラクターしているのはのらきゃっとだけで、他の人たちはリアルに源を持つチーティングな要素が多すぎる(それこそがバーチューバーの魅力なのかもしれないが)。
まず、キズナアイから輝夜月までの完全女性型ユーチューバーは、悲しいかな、本体の声の女性性に魅力の少なくない部分を負っていることは否定できない。声を起点にしてキャラの強度を性別に押し付けてしまって、主に生放送での挙動を女性のそれとして声優ラジオのように消費することは普通に行われているはずだ。
のじゃロリの場合はもっと明らかで、最初からバーチャルキャラクターではない。「コンビニバイトを退職したおじさん」ではなく「あの狐娘」のプロフィールは不明であり、そもそもキャラとして成立しているかどうかが怪しいところがある。のじゃロリがキャラか否かという無駄に射程の広い議論は避けるにしても、本体のエピソードや人柄に魅力の大部分を負っていることは間違いない。本体の声を使っている点も、先の性別についてとはまた別の意味で、優しそうな人柄を反映するやや反則気味の手段である。
結局、女性ボイスや本体のエピソードを持たない純粋なバーチャルキャラクターはのらきゃっとのみであり、彼女が持つ図像の意味は相対的に大きなものとならざるをえない。

先の記事に乗じて自己同一性(ここで言う自己同一性とは、自己言及としてのI=Iという本来の意味ではなく、外部からのらきゃっとを認証する際に行うものであることに注意)に関して言えば、基本的には図像が担保しており、誤認識のスリップによって欲望する主体としてその強度が極めて高いものになるが、図像が変更されれば瓦解するという具合になるだろうか。アバターだけを変更して同一のスタイルで同じようなキャラを生成することは可能だが、それは「のらきゃっと二号」とでも言うべき別個体であり、「一号」から引き継ぐものはないと考えている。確かに別個体にもスタイルの痕跡は見て取れるかもしれない、しかしそれは漫画家が別作品で画風を共有しているという程度の意味でしかなく、キャラクターとしては切断を逃れられない。


なんだか反論するような口調で締めてしまったが、俺的にはこっちの方が感覚に合致するという程度の話で、根拠を提示できるわけでもなければ意見をすり合わせるべく衝突していく意図でもない。予防線を張るわけではないが、最初に述べた通り、最重要は「誤認識によるスリップは無意識によるスリップを模倣する」という発見だ。
ただ、それはローカルなロジックが崩壊していてもよいという言い訳にはならないし、浅学故に元の記事を間違った読み方をしているのかもしれないので、そういうことがあったら申し訳ない。

終わる。