LWのサイゼリヤ

ミラノ風ドリア300円

24/12/26 ソシャゲのデータサイエンスというのはガチャの排出率を考えることではなくて……

【ChatGPTによるこの記事の要約】

かなり精度良い要約なのでこれだけ読めばいい気もする

この記事は、ソーシャルゲーム(ソシャゲ)のデータ分析に関する考察を述べています。以下は要約です:

ガチャの分析は単純な確率論
ソシャゲの「ガチャ」は収益やプレイ体験にとって重要だが、データサイエンティストが複雑な分析を行う必要はほとんどない。基本的な確率論(多項分布や幾何分布)で十分対応できる。また、ガチャは「真の母数が完全に把握できる」ため、他の確率が絡む分野(例:保険や金融商品)と比べて扱いやすい。

重要なのはユーザー行動の分析
データ分析の主な対象は、ガチャではなくユーザーのプレイ状況である。具体的には以下のような分析が行われる:

  • アクティブユーザー数やイベント効果の分析
  • 新規ユーザーのリテンション(定着率)の追跡
  • RFM分析を通じた課金傾向の把握

これらは一般的なtoCサービスと似ているが、ゲーム特有のドメイン知識が必要となる。

ゲームの閉鎖性が分析に影響
ゲーム世界は現実から断絶された閉鎖環境であり、ユーザー行動の動機が直感的に理解しづらい。一方で、外部環境からの影響を受けにくいため、安定した分析が可能になるという利点もある。

エンタメとデータの相性の悪さ
データ分析は過去データに基づくものだが、エンタメ分野は未来志向で新規性を重視する。この矛盾が、ゲームのコンテンツ内容に踏み込む分析を難しくする。結果的に、プランナーと相談しながら直感的な判断に頼らざるを得ない場合が多い。

留保的な結論
記事の内容は筆者の個人的な経験に基づいており、ソシャゲ業界全体の一般論ではない。ただし、少なくとも筆者のような考え方を持つ運営者がいたことを示している。

ガチャは大した確率モデルではない

俺は今データサイエンティストとして働いているが、自己紹介がてら「前いた会社ではソシャゲでちょっとデータ分析してたんすよ」的なことを言うと「つまりガチャの排出率設定とかやってたんすね」的な返しをされることが稀によくある。
確かにソシャゲと言えばガチャ、データ分析と言えば確率・統計、よってソシャゲのデータ分析と言えばガチャの確率・統計すなわち排出率という連想ゲームは自然ではある。

彦卿かよと思ったら新停雲来て熱かったガチャ

しかし収益上とプレイ上の重要性に反して、ガチャはわざわざデータサイエンティストが労力を払うほどの確率モデルではない。
というのも、数学的にはガチャは最も初歩的なくじ引きでしかないからだ。多項分布や幾何分布の期待値程度がわかっていれば、ビジネス上で必要な分析は事足りる(想定収益の概算など)。ステップアップや(裏)天井などの独自仕様を足したところで高校数学の範疇を出ず、そもそも一度開発を終えて運営フェイズに入ればガチャの立て付けはそう頻繁に更新しない。

補足565:逆に言えば高校レベルの数学がわかる必要はある。少なくとも「PU確率2%のガチャを50連引けば必ず当たる」と勘違いしない程度のリテラシーは欲しい。

少し統計がわかる人向けに書くと、ガチャは確率的な挙動をするビジネス上のキーファクターにしてはかなり珍しいことに「真の母数を最初から完全に把握している」という点で例外的に扱いやすいシステムとも言える(実現値から母数に遡る検定や推定全般を全く必要としないため、統計学というよりは確率論の領分)。
他の確率が絡む商品、例えば保険商品開発や金融商品取引ではこうはいかない。死亡確率や未来相場のようなクリティカルなパラメタないし確率変数の推定は社会情勢や災害のような外的要因に大きく左右され、それを知るデータ分析に大きな需要がある(ガチャにはない)。

平凡なサービス分析

ではガチャでなければ何を分析するのかと言うと、主にプレイ状況だ。
もう少し具体的にはログデータの分析、例えばイベントの効果を知るためのアクティブユーザー分析、新規ユニットの需要帯を知るためのユーザーセグメント別分析、初心者のリテンション模様を知るためのファネル分析など。何であれゲーム内のユーザー行動を分析することには専門知識の動員に値する複雑さとKPIに直結する需要がある。

補足566:他にもゲーム外でやれることとして時流を知るための競合分析や広告予算配分を最適化するためのマーケティング分析などもあるが、とりあえずはゲーム内の話に絞ることにする。

サービス内のユーザー行動を分析するという点ではこれらはソシャゲ特有の分析ではなく、世の中に数多あるtoC系サービス全般における分析内容とそう大きく変わらない。
例えばECサイトでは新規登録者が混乱せずにきちんと購入確定まで遷移しているかどうかを調べることが多いが、ソシャゲでも新規登録者がチュートリアルをつつがなく終えて育成に向かうような想定導線を辿っているかの追跡は重要だ。他に個別的な手法としてはより長く・頻繁に・多く金を使うユーザーの特徴を知るRFM分析などはいずれでも有効だろう。

ゲームという断絶された閉鎖世界

一方、ユーザー行動を分析する上でソシャゲに特有の点もある。
データ分析にはその領域特有のドメイン知識が必要なことはソシャゲに限った話でもないが、特にソシャゲにおいてはユーザーが参加しているゲーム環境が現実世界からほぼ完全に隔離された閉鎖世界であることが大きな問題になる。「領域に固有の細かい事情がある」というよりは「もはや一般的な事情が通用しない独自の世界を築いている」という方が近い。

これも一般的なECサイトと比較するのが分かりやすいかもしれない。
例えば適当なECサイトで日用品を購入するとき、缶詰を買うユーザーは食糧を備えておきたいのだろうし、防寒パンツを買うユーザーは冬で寒いのだろう。いずれにしてもサービス内での行動はサービス外における現実的な需要と対応しており、そのサービス自体には詳しくなくても行動動機は直感的に理解できることが多い。

ところが、ゲーム世界では全くそうはいかない。
遊びを生活から切り離して定義したのはたしかホイジンガだったと思うが、言ってしまえばソシャゲなんかやってもやらなくても生活には全く影響しないということが直感的な動機の理解を妨げる。
ゲーム内の行動は現実におけるあらゆる報酬に対応しない。武器を揃えたところで腹は膨れないし、サーバー一位になったところで冬は寒い。ユーザーがどうしてどうやって消費に至るのかというシンプルな属性分析ないしファネル分析を試みるだけで、分析者は「何が楽しくてこのゲームをやっているのか」という本質的な問いに向き合わなければならなくなる。
もっとも、この辺りはゲームプランナーの職能として概ね尽くされており、企画術以上に新しい論点があるわけではない。今言いたいのは、ゲームの分析は通常の生活からは根本的に断絶したユーザーの目的意識を把握しなければならないという点で他の多くのサービスとは異なるということだ(もちろん大きな目的意識だけではなく細かいシステムについても同様)。

一方、ゲームに特有の内界と外界の断絶が分析者にとってありがたいこともある。それは外部環境からの影響に対してゲーム内部のユーザー行動が極めて頑健なことだ。
ECサイトであれば競合サービスや社会全体の動向によって自前のサービス内での需要が大きく増減することは想像に難くない。楽天がプロテインを大安売りしたからAmazonでプロテインの売上が大きく下がるというようなことは当然よくあるだろう。
しかし、原神で足の速いシロネンがリリースされたからといって、スタレで足の速い飛霄の需要が下がることは有り得ないのだ。ゲーム内世界は他のゲーム内世界からさえも隔絶されており、ゲーム内の価値判断がゲーム世界内で完結しているために企画側で制御できない外乱による干渉は起こらないというメリットがある。

そもそもエンタメとデータの相性悪くない?

あとはソシャゲに限ったことでもなく、基本的にエンタメとデータは相性が悪いということを常々考えている。これは売れ行きやアクティブユーザー数のような表面的なKPI指標というよりは、ゲーム内ユニット性能のようなコンテンツ内容にまで踏み込んで分析をする際に顕著になってくることだ。

そもそもデータ分析とは基本的に過去志向の営みである。今までに累積されたデータを上手く解釈して過去に含まれる情報を抽出する主旨であり、未来予測ができるとは言ってもそれは過去の再生産を行っているに過ぎない。

一方で、エンタメは未来志向の新規性を常に求めてくる。例えばゲームで質的に最も歓迎されるのは新しい遊び感覚をもたらす新システムや新シナジーであり、過去の実装内容から容易に予想される効果しか持たないユニットは退屈なものとして敬遠される。よって何らかの施策を打つ(=新しいログデータを生成する)に際してはそれまでにないものを実装し、かつ、それが大きなインパクトを持つことが最も望ましい。

これをデータの言葉で言えば(回帰のイメージで言えば)、目的変数を説明するに際してかなり貢献度の高い説明変数が各データにそれぞれ個別に含まれているようなものだ。これは極めて頭の痛い状況であり、実際のところ、プランナーと相談しながら企画ドリブンで恣意的に切り分けた調査を行うくらいが妥協点になるだろう。

他の人のことは知らんけど(留保)

普段から自己紹介ついでに同業者に喋っていがちなことをつらつら書いたが、ソシャゲ会社はもう辞めてるし、ここに書いてあることを全てやれていたわけでもない。
そもそもソシャゲ会社のデータ活用度合いはかなりピンキリでコンセンサスがあるわけでもないので、ここに書いたことをソシャゲ業界の一般論と思われるとあまり良くない。データがわかるソシャゲ運営者の中にはこんなことを考えていた人が少なくとも一人はかつていたくらいの温度感で読むのが正しい。