LWのサイゼリヤ

ミラノ風ドリア300円

24/4/25 お題箱回154:論理飛躍、データと固有名etc

お題箱回154

954.既出かもしれないですが、カードゲーマーって本当に臭いんですか?
もしそうならなぜここまでネタになっても改善されないんだと思います?

実情については概ね回答916で書いた通りです。あと最近池っち店長が語っていた内容も良かったです。

saize-lw.hatenablog.com

そしてネットでネタになったくらいで臭い問題の改善を期待するのは臭い男の解像度が低いです。ネットを見て「もしかしたら臭いかも」と思って対策できる人は最初から臭くなりません。カードショップで臭い層は「たまたま忙しくて身だしなみに気が回らなかった」という一時的な不調によるものではなく、人生で臭いを気にしたことも指摘されたこともないケースがほとんどです。

だから「臭いって気にした方がいいのかもしれない」と最初に自覚するイベントがまず必要で、それが池っち店長が書いている「直接の指摘」だったりします。逆に言うと、そういう個別具体的なイベントがないと臭いなんて割とすぐ慣れてしまうものです。

 

955.LWさんにお題回答してもらったのが気持ち良すぎてクセになりそうです

良かったですね。気持ちよさは欲しいものリストで還元できます。

なんか「サイゼリヤでダベるときに喋るようなことを書く」という当初のブログ設立趣旨がだいぶ前から崩れていて、解決策とかバリューを求めて人々が訪れてくる無料版のプロ奢られヤーみたいな立ち位置になっているような気が薄々しています。

 

956.「『実在児童のポルノを学習したAIにより生成した画像は非実在児童の画像であって児童ポルノにならない』のであればピクセルの集まりを表す電圧の高低にすぎない画像データも児童ポルノにはならない。」という意見にはどのような論理飛躍がありますか。また「不可逆圧縮や低解像度化で劣化が生じたりアップスケーリングで補完した部分は現実と離れる事になりその部分は非実在になり児童ポルノでなくなる。」という意見にはどのような論理飛躍がありますか。

論理飛躍というのは順当な推論過程の中間が抜けていることを指しますが、これはそもそもの推論過程がめちゃくちゃなので論理飛躍ではなく意味不明といいます。

様々なケースが児童ポルノに該当するか否か判断したいのであれば、まず最初に児童ポルノの定義を確定して、そこにケースを当てはめる順序で書きます(演繹)。様々なケースの仮定から児童ポルノの定義について考えたいのであれば、まずケースの共通点や包含関係を明確にして、児童ポルノの要件を推定する順序で書きます(帰納)。

一応最大限好意的に汲み取ると、全体的には以下のような三つの主張があるようです。

主張①:「AI生成した非実在の児童の画像」は「実在する児童の画像」ではないので児童ポルノではない
主張②:「電圧の高低に過ぎない画像」は「実在する児童」ではないので児童ポルノではない
主張③:「アップスケーリングで補完した画像の一部」は「実在する児童の画像」ではないので児童ポルノではない

主張①と主張②を形だけ順接で繋いだのが一つ目の文章で、主張③をポン置きしているのが二つ目の文章です。

主張①と主張②で児童ポルノの定義が明らかに異なっているので、この二つを繋いだところで何が言えるのかわかりません。一応、主張②が正しければ主張①は自動的に正しくなるので「主張②ならば主張①」ならまだギリギリわからなくもないですが(画像全般が児童ポルノに当たらないとするのであれば、描写されているものが何であろうが画像である時点で当然に児童ポルノではない)、それは論理的には自明すぎるし内容的には違和感のある主張です。主張③も定義に失敗した単語を元手に推論を試みているので何もわかりません。どちらも論理飛躍以前です。

 

957.バンドや歌手など、アーティストのライブは行ったことありますか?

特にありません。行かない信条があるわけではなく、メディアから聞くので十分満足できるのでお金と労力を払ってライブに行きたいと思うことがありません。

 

958.サイゼミでの訂正可能性哲学の評読みました 特に気になった箇所があったのでお聞きしたいのです 自分のイメージでは、東が批判している対象はビックデータ分析ではなく統計的な手法全般だと感じています 分析哲学のアナロジー(確定記述の束≠固有名)から、統計的な手法では個を扱うことが究極的にはできない点を指摘しているのかなと
門外漢なのでわかりませんが、lwさんのいうようにこの点は良いモデル、あるいはデータサイエンティストがモデルの更新に介入すればで乗り越えられる程度のものなのでしょうか?

これの話ですね。

saize-lw.hatenablog.com

この話はサイゼミでも少し出ましたが、記事で立ち入らなかったのはそこまで掘り下げなくても現実的な話で十分だと考えたからです。

『訂正可能性の哲学』全体が理論的な整合性というよりは実践的な有効性を志向しているのでそれを尊重したのが一点、東がデータサイエンスにはあまり詳しくなさそうなので数理方面から厳密に詰めても建設的ではないと感じたのがもう一点です。特に東はFICOスコアには好意的だったので、「データ分析は究極的に固有名概念を扱えるのか」というよりは「データ分析はFICOスコア程度のレベルで個人情報を扱えるのか」を考えた方が本来の論旨に沿うだろうと考えてそちらに寄せています。

とはいえいま質問が来たので「統計的な手法は固有名を扱えるのか」に答えておくと、半分はNOで半分はYESです。かなり大雑把に言うと、純粋に理論的な統計手法においては固有名を扱いませんが、現実の実践的なデータサイエンスにおいては固有名を扱います。

まず純粋に理論的な統計手法においては、概ね個体は確定記述の束に還元されます。これは統計学に限ったことでもないと思いますが、そもそも数学の体系は色々なものを抽象化することで成立しており、無根拠に付いたネームタグを扱えるように作られていません。時系列データなどであれば変化していく個体を抽出することもありますが、そうは言ってもそれは変数の塊に過ぎず、固有の魂を見出さない方が理論的に正しい態度だと思います。

しかし一方で、データサイエンスの実務においては固有名が明確に存在します。というのも、何らかのシステム上でデータを扱う際にはデータベース上で「ユニークid」というものを必ず割り振るからです。

補足523:理論上はユニークidを使わずにデータベースを構築することも決して不可能ではありませんが、インターン生でも許されないレベルのクソ実装です。

ユニークidというのはマイナンバーみたいなものだと思ってもらえればよいです。システムの利用者一人一人に重複しないように割り振って、性別や年収や居住地がどんなに変化しようとユニークidだけは絶対に変わりません。ユニークidはソクラテスが性転換しようが羊飼いになろうがいつでも必ずソクラテスその人を示すため、固有名のイメージに対応します。この「きちんとユニークidを振って属性が変わっても個人を特定し続ける」という挙動はデータ分析の実務上でもかなり重要です。

例えば、あるコンビニの利用客を考えてみましょう。このコンビニには以下の二人の常連客がいるとします。

  • 客A:毎日朝に来てストゼロを買う太った女性
  • 客B:毎日朝に来てサラダチキンを買う痩せた男性

2024年4月25日、この二人は全く同時に性転換と肉体改造を思い立ちました。客Aは男性への性転換手術を受けて激痩せしてサラダチキンを買うようになり、客Bは女性への性転換手術を受けて激太りしてストゼロを買うようになりました。この結果、客Aと客Bのステータスは以下のように完全に入れ替わることになります。

  • 客A:毎日朝に来てサラダチキンを買う痩せた男性
  • 客B:毎日朝に来てストゼロを買う太った女性

確定記述と固有名の問題からすると、2024年4月25日の前と後でこの二人が入れ替わったことをデータ上で判別できるかどうかが今の論点です。判別できなければ客は確定記述の束として扱われていますが、判別できれば客は固有名として扱われています。

まず第一のケースとして、「コンビニ店員が来た客の見た目と性別を逐一メモして記録している」としましょう。この場合、2024年4月25日の前後で同じように「太った女性がストゼロを買い、痩せた男性がサラダチキンを買った」と記録されるだけです。店員は二人の見た目が入れ替わったことに気付きません。その記録を用いて客層を分析する際も「客の状態は特に変わらなかった」ということになるでしょう。

しかし第二のケースとして、「全ての客が会員カードを持っていて、レジで買い物をするとき必ず会員カードをスキャンし、その上でコンビニ店員が客の見た目と性別を端末に入力して記録する」としましょう。客の見た目がどんなに変わろうとその人が持っている会員カードの会員番号は変わらないため、会員番号と照合すれば客Aと客Bの見た目が入れ替わったことに気付けます。つまり会員番号というユニークidを固有名として確定記述に依存せずに客の変化を判別できます。

補足524:厳密に言えば会員番号をユニークidにする実装は多分しないと思いますが(会員番号はチェックディジットとか他の事情が色々絡むしそもそも表に見せたくないのでまた個別にユニークidを取るのが現実的な実装だと思いますが)、今は説明のために簡略化しています。

この記録を用いれば、先ほどとは全く異なる客層分析が可能になります。例えば性別が変わっている客が複数いることがわかれば「性転換が流行っていること」に気付けますし、更にそれを受けた施策として「性転換経験がある人向けのキャンペーン」を打つ場合には会員番号という固有名によって死守された個人情報が生きてくることもあるでしょう。

少し長くなりましたが、「固有名は純粋な統計学では考慮されないが、現実的なデータサイエンスの現場では存在する」というのはこういうことです。東が人工知能民主主義で想定している人類一元管理みたいな状況ではおそらくユニークid的なものは存在すると思われます。

補足525:マーケティングにおいて会員登録が重要な理由もここにあります。顧客に会員カードを作ってもらうだけで、同じような客が同じように来ているように見えたとしても「実はその背後で何が起きているか」の解像度がグッと上がります。他の例としては、毎日全く同じ数の利用者がいるとしても「ずっと同じ人々が同じように利用しているから利用者数がずっと同じ」と「離脱した客と新規の客がたまたま毎日同じ人数だから利用者数がずっと同じ」では全く違う事態であり、この違いを認識するためにはやはり確定記述に依存しない固有名の把握が重要になります。

 

959.AIVtuberのNeuro-samaを知っていますか?
https://www.youtube.com/watch?v=bGHR5eEgxfs
ポンコツかわいいAIと人間のツッコミという構図が某のべりすととそっくりで、AI創作の最先端ってマジだったんだなと思いました。

www.youtube.com

知っています。最近TwitchでSlay the Spireをやっていたのを少し見ました。

日本語を喋ってくれるAIずんだもんもたまに流していますが、確かにどちらも盛り上がるのは突っ込みどころがあることを言うタイミングで、AIのべりすとと同じ楽しまれ方をしていますね。

 

960.DECO27と谷川俊太郎の10年前の記事が話題になっていますが、有名作を履修する事とヒット作を作る事の関係についてどう思いますか?

これですね。

www.cinra.net

音楽のことはよくわかりませんが、常識的に考えてアウトプットとインプットには一定の関係があるだろうと思います。それ以上は個人差もあるでしょうし特に思うところはありません。人によります。

 

961.30歳男性・オタクです。「言及してもいいんだけど諸々を考えて黙っておく、若しくは言葉を濁す」というのが、加齢で丸くなるという現象の正体に思えてきたんですが、これって結局のところ自我がどんどん薄くなっていって、じゃあ適当な頃合いで身を固めてベタに子どもと家族の為だけに奉仕するだけの人生でもええやんええやん👍ってなりそうじゃないですか?怖くないですか?

それは別に全然良くないですか? 特に怖くないし何ら問題ないと思います。そういうビジョンに問題を感じなくなるのも加齢の影響かもしれません。

ちなみに加齢で丸くなるのは「人生の関係者が増えてきて利害が複雑になるから」以外にも「社会経験によって何となく事情や背景を推察できるようになるから」とか「揉めやすそうな話にいっちょ噛みしなくても他のところで承認欲とか実現欲を満たせるチャンネルが確保されるから」とか色々あります。

 

962.会社選びの基準の優先度はどんな感じですか。
給料>>>労働時間>周りの優秀さ>>>仕事のやりがい
みたいな大小で教えてくれるとありがたいです。

そもそもあまり基準の優先度みたいな考え方では就活していませんでした。仕事って人生でもあるので、人生には数値に還元できない質的で個別的なものがたくさんあるし、個々の要素の足し合わせが全体と一致しないことも多いです。

だから求人票とか内定通知書に書いてあるような数字だけを量的に足し引きしてどうこうみたいな感じではなくて、諸条件の最低ラインはクリアした上で総合的に勘案して未来を具体的にイメージして決めるという感じです(幸いにも最低ラインは一つも諦めずに済んだのでその優先度も特に考えていません)。その上で全体的な指針として重要なのは仕事で自己実現できそうかどうかです。

 

963.LWさんは肉体的・頭脳的な衰えを感じていますか?それらの衰えに対する恐怖心みたいなものがあるのですが、どう対処するのがいいと思いますか?(「まぁ仕方ない」と受け入れる以外ないように思いますが……)

今は特に感じていませんが、筋トレとか食事とか睡眠とか健康的な暮らしをするのが第一だとは思います。感じ始めたら考えが変わってくるかもしれません。

 

 

何か買ってもらえると嬉しいです。

www.amazon.jp