LWのサイゼリヤ

ミラノ風ドリア300円

22/12/3 2022年6~8月消費コンテンツ

2022年6~8月消費コンテンツ

4ヶ月ぶりの消費コンテンツ更新で未だに夏の話をしている。

6~8月は理系出身者らしく技術系書籍を読んだり技術資格を取ったりしていた。

そろそろ真面目にKaggleやるかと思って名前にKaggleと付いている本を全部読むやつをやっていたが、完了しないうちにデータベーススペシャリストの試験日が迫ってきてそっちの勉強に移行してしまい、結局Kaggleには未着手のままで再開するかどうかは微妙なところだ。コンテスト形式ってあんまやる気出なくない?

メディア別リスト

アニメ(12話)

処刑少女の生きる道(全12話)

漫画(17冊)

カイジ24億編(1~17巻)

書籍(16冊)

データサイエンティスト検定(リテラシーレベル)公式リファレンスブック 第2版
ディープラーニング活用の教科書 実践編
深層学習教科書 ディープラーニング G検定(ジェネラリスト)公式テキスト 第2版
データサイエンティストの育て方
AI・データ分析プロジェクトのすべて
徹底攻略 データベーススペシャリスト教科書 令和4年度
分裂する現実 ヴァーチャル時代の思想
リーダブルコード
PythonではじめるKaggleスタートブック
データ分析が支えるスマホゲーム開発
データサイエンスの森 Kaggleの歩き方
はじめてのPython & seaborn
入門Python3
データ分析のための数理モデル入門
Kaggle Grandmasterに学ぶ 機械学習 実践アプローチ
pandasクックブック ―Pythonによるデータ処理のレシピ―

資格(3個)

応用情報技術者
G検定
データサイエンティスト検定(リテラシーレベル)

 

良かった順リスト

人生に残るコンテンツ

(特になし)

消費して良かったコンテンツ

データ分析のための数理モデル入門
応用情報技術者

消費して損はなかったコンテンツ

pandasクックブック ―Pythonによるデータ処理のレシピ―
処刑少女の生きる道
カイジ24億脱出編
データサイエンティスト検定(リテラシーレベル)
データサイエンティスト検定(リテラシーレベル)公式リファレンスブック 第2版Kaggle Grandmasterに学ぶ 機械学習 実践アプローチ
G検定
深層学習教科書 ディープラーニング G検定(ジェネラリスト)公式テキスト 第2版徹底攻略
入門Python3
リーダブルコード
PythonではじめるKaggleスタートブック
データベーススペシャリスト教科書 令和4年度

たまに思い出すかもしれないくらいのコンテンツ

はじめてのPython & seaborn
AI・データ分析プロジェクトのすべて
ディープラーニング活用の教科書 実践編
データサイエンティストの育て方
データサイエンスの森 Kaggleの歩き方

以降の人生でもう一度関わるかどうか怪しいコンテンツ

分裂する現実 ヴァーチャル時代の思想
データ分析が支えるスマホゲーム開発

 

ピックアップ

処刑少女の生きる道

異世界転生オタクがやたら勧めてきたから見たが、確かに見る価値があるアニメだった。全体的に逆張りし続けるのがかなり良くて見ていて飽きない。

ジャンルとしては異世界転生亜種だが、美少女主人公が異世界転生者ではなく異世界在住者というのがまず良い。そして「転生してくる日本人がチート能力で世界を荒らすのがクソ迷惑だから片っ端から殺す」というあまりにも露骨な異世界転生ものへのカウンター設定がとても良い。「転生者を殺したい主人公」と対になる位置に「異世界にワクワクしている典型的なオタク日本人転生者」であるヒロインが置かれており、主人公が表面的にはヒロイン(≒視聴者)が望んでいる異世界百合萌えヒロインを演じながら隙を見てヒロインを殺そうとしている関係は浅薄な百合ものへのアンチスタンスでもある。

ただ、「異世界転生における転生者の加害性」というテーマ自体はループを絡めて既にリゼロが提起している内容ではある(このブログでも何度か扱っている→)。視点を転生者から異世界者に変えるなどの工夫はリゼロの変奏として優れてはいるが、少なくとも一期の範囲では情報量不足でどのように発展していくのかが見えにくかった(中ボスとラスボスのどちらも主題とあまり深く関与しなかったのもある)。結局のところ主人公はヒロインと折り合いを付ける方向に着地しつつあること、ヒロインも一貫して主人公に協力的であることから、百合ものとして穏当な着地点に向かっているようにも見える。

ただ原作ラノベを読んでいるオタクによると一期以降の展開はもっと面白くなっていくらしいので、二期があれば見てもいい。暇なら抑えておきたい、ポテンシャルはかなりありそうなアニメ。

 

カイジ24億脱出編

賭博堕天録 カイジ 24億脱出編 17

賭博堕天録 カイジ 24億脱出編 17

Amazon

前に8巻くらいまで読んで、気付けば17巻まで出ていたので読み直した。もはやギャンブル漫画ではなくなって『最強伝説黒澤』的な人生漫画になってきているが、しかしそれがかなり面白い。

ここまでのシリーズで大金を求めて戦い続けてきたカイジが実際に24億を手に入れたあと、それでも人生は完結せずにその先が延々と続いていく様子が執拗に描かれる。10巻くらいまでは帝愛とのチェイスがエキサイティングに描かれていたが、それ以降は概ねカイジ有利で盤面が固定されて日常系っぽいものがダラダラと続いている。大金を入手したところでカイジは社会的なポジションを手に入れたわけではなく、帝愛に追われる立場で波長が合うのはどこまでも社会の隅で燻ぶるダメ男たちしかいない。

10巻以降の新たな展開として、敵である帝愛側の描き方も大きく変わってきている。今まで焼き土下座や指切りによってわかりやすく反社会的な悪の組織として描かれてきていたが、黒崎や遠藤を通して描かれる帝愛内部の実情はスピンオフのトネガワやハンチョウに近いものだ。それぞれがそれぞれの人生の中で人間味ある苦労を背負っており、帝愛の人々ですら泥臭い地続きの人生から逃れられていない。

これは単なる迷走や蛇足ではなく、ギャンブル漫画時代のカイジが持っていたテーマとも繋がっている。カイジがギャンブル中毒であることは今までのシリーズでも何度も描写されており、ギャンブルを続けることがギャンブル漫画の主人公としてのアイデンティティでもあった。黙示録編のように「結局ギャンブルに負けて金への渇望を維持する」という安直な末路は彼の役割をマッチポンプで延命させるだけであり、逆に「超大金を手に入れる大勝でギャンブルから離脱できるかもしれない」という局面にこそ真の葛藤が生じる。この漫画とカイジ自身がパラレルに落としどころを探していくという立て付けはギャンブル漫画の誠実な続編として興味深く、続きも楽しみにしている。

 

応用情報技術者

試験自体は4月に受けたやつの合格通知が6月に来た。もともと基本情報しか持っていなかったのでそろそろアップグレードしたかったのと、本命のデータベーススペシャリスト試験一部免除目当てで取得しておいた。

広く浅く膨大な範囲の知識を問う試験なので特に何が面白かったというわけでもないが、とりあえずうっすら技術的な会話に必要なボキャブラリーは身に付くので取っておいて損はしない系の国家資格ではある。いまどき大抵の会社でIT関連の知識が全く要求されないということはないだろうし、Twitterで技術的なトピックが話題になったときにちょっと調べればふんわり理解できる程度の知識は付く。

 

G検定/深層学習教科書 ディープラーニング G検定(ジェネラリスト)公式テキスト 第2版

G検定のGはGeneralistのG。ディープラーニングに係る諸々の内容をざっくりジェネラルに把握していることを保証する資格。

ディープラーニングを中心とした機械学習の標準的な解説はもちろん、歴史的な経緯も重視しているのが単なる技術資格と違って独特で面白いポイントだ。例えば「エニアック」や「ダートマス会議」など、人工知能に関連する歴史上の重要事項も抑えておくのは、技術のみならずジャーナリズムにも通用するジェネラリストの名に恥じない味わいがある。

ニューラルネットや様々な派生ネットワークに関する解説は思ったよりはかなり充実しており、様々な分野でのネットワークが20個以上も紹介されている。こちらも最先端の実用性というよりは歴史的なメルクマールとなったネットワークを抑えようとする思想が伺える。数式ベースではないにせよ、目的と特徴くらいは把握できるので自分で実装するのではなくざっくりディープラーニングの話をする程度ならこれで十分そうだ。

難易度も高くはなく、とりあえずざっくりディープラーニングを知りたい人にはオススメできる資格。

 

データサイエンティスト検定(リテラシーレベル)/データサイエンティスト検定(リテラシーレベル)公式リファレンスブック 第2版

あまりモチベーションは高くなかったが、思ったより芯の通った良資格だった。難易度も高くなく、データサイエンスに関心があるなら取っておいて損はしない。

分野特化的な他の類似資格と比べて、データサイエンティスト検定を名乗るだけのことはあって全体指針を定めるベースラインを提供するポジションであろうとしている気概が好印象。数学的な内容はそこそこに、データ分析結果をプレゼンテーションする際の図示のコツや業務中のマインドに至るまで一通りが網羅されている。今後も時勢に応じて内容を更新していくつもりらしく、発展性も十分にあるので他のレベルも整備されたときは一つのデファクトスタンダードになるかもしれない(今は最低レベルの「リテラシーレベル」しか存在していない)。

 

データ分析のための数理モデル入門

かなり良著。作者がちゃんとした研究者で、しかもいい人。

統計、機械学習、制御に至るまで様々な数理モデルを統一的に体系立てて並べ、状況に対してどれを選択すべきかを解説しており、分野横断の視点が得られる貴重な一冊。それぞれの解説は厚いわけではないのでこの本で全てを理解するのは無理があり、初学者はこれを読んで各分野を勉強してからまたこの本に戻ってくることになるだろう。

内容の特徴として、理解志向型(データの生成メカニズムを理解する)と応用志向型(手元のデータを元に未知のデータを扱う)のモデリングをしっかり分けた上でそれぞれのポイントを合目的的に解説し、各分野について漫然と学んでいるだけでは看過してしまう注意点を手厳しく指摘している。

とりわけKaggle本をいくつも読んでいる最中だったので、Kaggleで有効とされる手法が必ずしも常に有効とは限らないと釘を刺しているのは特に勉強になった。例えばKaggleでは特徴量エンジニアリングや欠陥値補完の作業が重要視されるが、それは応用志向型のモデリングだから役に立つというだけで、他の局面では基本的には推奨されないことが明言されている。加えて「定量的に十分な予測能力を持たないモデルにおいて、パラメータの値を細かくきっちり決める行為には意味がありません」とも語られており、パラメタ探索による精度上げゲームに陥りかねないデータサイエンスに警鐘を鳴らしてくれている。


pandasクックブック ―Pythonによるデータ処理のレシピ―

良本。pandasライブラリを利用する本やサイトは多いが、pandasそのものを深く解説しているのはけっこう貴重だ。

pandasの細かい要素型や処理挙動の注意、記法による計算速度の違いなどが細かく記載されている。pandasを扱う上で色々な記法があって混乱していたり、同じ処理に複数のメソッドが可能な場合に結局どれを使えばわからない場合などには役に立つだろう。他の本だとpandasは基本だけ軽く説明するか、細かい使い方はいちいち解説されずにサラッとコードだけ提示して流されがちだ。pandasを使うならとりあえず読んでおく価値がある。

ただレベル感は低くなく、プログラミングの一般的な用語や作法がわかっている人向け(この本からPythonによるデータ分析を始めるのはオススメできない)。

 

入門Python3

Pythonについては「退屈なことはPythonにやらせよう」でざっくり学んだが、あちらは「細かい文法はともかくとりあえず使えるスクリプトを書けるようになろう」というコンセプトだったため、そこでフォローされていないワンランク高度な文法を把握するために信頼のオライリーを一冊読んだ。具体的にはクラス、高階関数、デコレータ、ダンダーなど。

辞書みたいな厚さだが説明は平易でよくまとまっているので読みやすい。後半になるとあまりきちんと説明せずとりあえずライブラリ名だけ列挙して紹介で済ませているような節もあったが、それもPython仕草ということでまあ良いだろう。

なお書名には「入門」とあるが、プログラミング初心者のプログラミング入門という意味ではなく、プログラマー向けのPython言語入門の意だ。要求ラインはそれなりに高く、特に説明がなくてもポインタくらいはイメージできる人向け。

 

Kaggle Grandmasterに学ぶ 機械学習 実践アプローチ

コードを書く練習に使った本。ここに書いてある内容を滑らかに書けるようにkaggle notebookを回した。Python機械学習の基礎をコーディングする本は他にもいくらでもありそうだし、この本がベストかどうかはわからないが、たぶん必要な内容は概ね記載されているので別にこの本でも良いだろう。

ただ説明はそれほど丁寧ではない。きちんと解説してからコードを書くのではなく、解説そのものをコードで済ませるタイプ。既にPythonを扱える前提でライブラリ利用も見ればわかるだろor自分でドキュメント読めという感じであまりちゃんと説明されていない。特にNLP周りなどは説明がざっくりすぎたのとあまり関心も高くなかったので軽く目を通しただけでコーディングしていない。

 

徹底攻略 データベーススペシャリスト教科書 令和4年度

データベーススペシャリストの標準的な教科書。応用情報と被る午前Ⅰ試験の内容が多いので、既に応用情報を取得しているなどして午前Ⅰが免除or勉強済の人は別の本でも良いかもしれない。

データベーススペシャリスト教科書に関しては翔泳社のもの(→)が群を抜いて爆裂に良いので基本的にはそっちを理解することを目指すのが良いと思う(それはたぶん10月の消費コンテンツで書く)。翔泳社の本はかなり癖があるので他の本で補完する必要はあるかもしれないが、最終的には翔泳社を読まずにデータベーススペシャリスト試験に臨むのは有り得ない。

 

PythonではじめるKaggleスタートブック

Kaggle最初の一冊として読んだ。理論的にはだいたい知っている内容でも、やはりコードを書くとわかることは多い。

地に足の付いた解説が多いのが良く、とりわけ実行時間を考慮した進め方の効率にも触れられているのは勉強になった。例えば特徴量選択に比べればハイパーパラメタチューニングは優先度が低いので後回しでよいとか、アンサンブル学習は逐一実行しなくても最終的に分類器が出揃った段階で適用すればよいとかいう部分がそうだ。全てを一瞬で処理する数学的な書籍だけではわかりにくいが実践的には重要なポイントだろう。

 

リーダブルコード

コードを書く機会が増え、エンジニア界では有名らしいので読んでおいた。全体的には「最短時間で理解できるのが良いコードだ」というフィロソフィーの下でそれを実現するための様々なコツが紹介される構成で、体系的な理論というよりはテクニック集に近い。

俺は終始「自然言語と同じだな」と思いながら読んでいた。自然言語においても最短時間で理解できるのが良い文章だし、細かいテクニックについてもほぼ全てが共通する。例えば一度に多くを語ろうとしないこと、無関係の話題は分離すること、選ぶ単語が正鵠を射ているかにはこだわること、不要な単語を落とすこと、肯定形を用いること、熟慮した具体例を提示すること等々。

更に類推を重ねれば適切な関数の利用は重要なパーツを抜き出して別個に解説するという意味でAppendixの利用に相当するし、コメントの利用は補足の利用に相当する。コードでも自然言語でも恐らく読解の枠組みは概ね同じであり、コードの方が形式言語であるが故に注意点が明確になるのだろう。

 

はじめてのPython & seaborn

Kaggleで頻出するseabornライブラリがよくわからなかったので読んだ。技術的には特に優れたポイントがある本ではないが、とりあえず必要なことは網羅しているため目的の達成には支障なく使える。

結局seabornとはmatplotlibのラッパーであって、融通の利かないmatplotlibではダルいコードになるところをブッ飛ばして図示できるらしい。seabornで済ませられそうなところは素直にseabornにして、それで済まない微調整があればmatplotlibでやるのが良さそうだ。

この本だけの魅力として、著者が理系技術者ではなく文系教授なので全体的に技術者の文法で書かれていないのがかなり面白かった。コードをコードブロックで書かずに文中にベタ書きしたりスクショで済ませたりするし、入力後に反応がなくても焦らずしばらく待つ旨やBackSpaceキーの使い方などをわざわざ解説している。ページ全体から漂う1990年前後感に対し、2019年刊行で比較的新しい言語を解説しているというギャップが染みる。

説明の順序も技術的に標準的なものではなく、必要になるたびに都度都度導入するのが特徴的。フォントの話をしている途中にフォントごとにアクションを分岐できた方が便利だよねと制御構文if elseを初めて導入するなど、アクロバティックで自由な進行は面白く読める。比較的些事と思われる色やカラーパレットの変更方法について一章を割いて熱心に説明しているのも謎。

 

AI・データ分析プロジェクトのすべて

プロジェクトベースでデータ分析を解説する実務家向けの書籍。内容的にはデータサイエンティスト検定との重複が多い。

「理論だけでやれると思うなよ」と釘を刺す姿勢が一貫しており、不確実性の高い業務につきコミュニケーションや期待値コントロールの重要性が強調される。理論以外の企業活動におけるポジションとしてのデータサイエンティストが業務上でどう振る舞うべきか、求人票の見方やキャリア生成方法まで解説されている。

ただ、これはこの本に限ったことでもないのでここに書くのは若干アンフェアだが、EXCELに関しては認識が古いようだ。EXCELは表示限界の100万行程度しか扱えずいちいちグラフやEXCEL関数で整形しないといけないので本格的な分析用途には扱えない……という認識はけっこう誤っている。現代のEXCELには分析用の専用機能がデフォルトで備わっており、CSVやWebリソースからデータをフェッチして20億行程度なら取り込んだ上で複数のテーブルをマージしてグラフ化までをパイプライン化可能で、Office以上の追加投資なしで簡易BIツールとして扱えるポテンシャルを持っている。このあたりはPowerPivotの書籍などが詳しい(→)。

 

ディープラーニング活用の教科書 実践編

G検定で推奨されていたので一応読んだが、読んでもいいけど読まなくてもいいくらいの内容。実務的にどういう利用が可能そうか知りたければ読んでもいいかもしれない。

「実践編」じゃないver(→)も存在しており、それは5月の消費コンテンツに書いた。どちらもGPT(General Purpose Technology;汎用目的技術)としてディープラーニングを用いた事業事例を紹介しているのは同じ。あちらが自動化等で工数などの比較的些末な経営課題を解決するというマイナスをゼロにする方向性だったのに対して、こちらは新しい価値創造を試みるゼロからプラスへの事例が多く扱われている。

 

データサイエンティストの育て方

タイトル通り「組織としてどうデータサイエンティストを育てるか」を開設した人事向けの本だが、何故かデータサイエンティストは一貫して「優秀だが社会性に問題がある人間」として描かれており、業務内容がどうこうというよりは朝起きられないとか騒音が苦手とかいうADHD傾向とどう付き合うべきかみたいなことが延々と書いてある謎な内容。常識的に考えてそれは人によるのでは?

データサイエンティストというジョブが今よりもマイナーで一点突破の変人しかいなかった時代に書かれたものかと思ったが、2020年刊行なのも謎。ただ著者は経歴含めてきちんとしていそうなことは柔軟な文章からも伺え、どうやってこの本が生成されたのか謎が深い。

 

データサイエンスの森 Kaggleの歩き方

Kaggle入門系の一冊。理論的な内容やコーディングには一切触れずにKaggleの使い方やコンペの典型的な進行についてひたすら解説している点が他の類似書籍との特徴的な差別化点となっており、目を通しておく分には損しない。

コンペに使わなくても環境構築済みの分析プラットフォームとしても使えること、教育コースが用意されていることあたりは他の本にはあまり書いていないのでこれを読んで初めて知った。

 

データ分析が支えるスマホゲーム開発

2014年の本でスマホゲーム史からするとまあまあ古い。

本文中の時代認識としてはブラウザゲームからネイティブアプリへの過渡期くらい、怪盗ロワイヤルみたいなポチポチゲーだけではなくきちんとゲームとして遊べるものがこれから増えてくるくらいの時期に書かれたものらしい。

内容は悪くはないがとにかく取っ散らかっていてトピックの粒度もハチャメチャだ。チーム編成からドメイン知識からマーケティングからツール選択まで幅広く触れており、ユーザーの導線について述べたかと思えば技術的なツールの導入手順まで詳細に解説されていたりする。全てフォローしていこうという心意気は良いが、紙面がそんなにないのでどれも中途半端な説明に留まっており、時代が大きく進んだ今から見てあえてこの本を参照する必要はあまりないかもしれない。できることは何でもチャレンジしていた黎明期的な時代の熱量を感じるアイテムとしては良。

 

分裂する現実 ヴァーチャル時代の思想

現代的なタイトルに反して1997年の本。

よってタイトルの「ヴァーチャル」とは21世紀のVR時代を踏まえたものではなく、神戸連続児童殺傷事件が起きるような世界観を指している。この本に限ったことでもないのだが、20世紀末期頃の人文的な書籍ではゲームネイティブ・デジタルネイティブ世代やテレビメディアの影響力を指して「バーチャル」と言われていることが多い。今で言うバーチャルとはイメージが異なっていがちなので注意が必要。

当時のヴァーチャル観で何かわかるものがあればいいと思って読んだが、色々な哲学理論を引いてくる割には話題が取っ散らかっていて全体的な論旨の理解に苦しむ。大雑把にはクリプキ的な世界観からストア的世界観へという話なのだろうが、ストイシズムの神話的読解からリアルの話に着地する部分の記述が貧弱で最終的に何が言いたかったのかはよくわからない。

ただ、中盤での指示理論に関する話題は図式的にも整理されていてけっこう面白く読めた。特にクリプキが記述理論へのアンチテーゼとして行った「ソクラテスは哲学者ではなく羊飼いであった世界を想像できるから、ソクラテスは属性に依存せず直接指示可能である」という主張に対して、「それはソクラテスが有名人だから成立する指示であって無名人には成立しないし、本当の核心は有名か無名かではないか」というようなことを指摘していたのは目から鱗だった。

ソクラテスのような有名人の人生は「他の生き様であり得ることもできた」という意味で単なる存在ベースで語れるが、名前の残らない無名人の人生は「彼の人生における功績は彼自身が存在しなかったとしても別の似た人間が遂行しただろう」という意味で存在意義ベースで語られる。確かに!!

 

生産コンテンツ

趣味で書いている小説『ゲーミング自殺 16連射アルマゲドン』の進捗報告です(前回分→)。

6~8月は表紙イラストを描いて頂けるイラストレーター様への発注が済んでメールでやり取りする作業が主で、文章の方は新規作成というよりは読み直して気になったところを修正していく推敲作業のみやっていました。

この記事を投稿している12月3日時点では第60話くらいまで投稿しており絶賛毎日更新中なのでよろしくお願いします。

www.alphapolis.co.jp

キャラ紹介:生成AI導入前後

今まで進捗報告でのキャラ画像にはキャラメーカーを使っていたが(→)、NovelAIを導入したことでもっと自由にキャラクリできるようになったのでその前後を置いておく(左がキャラメーカーによる旧ver、右がNovelAIによるリライトver)。

けっこうキャラデザを保ったまま自由な挿絵が作れていて、やっぱりオリキャラが生成できるのはかなり良い。