LWのサイゼリヤ

ミラノ風ドリア300円

24/2/11 お題箱回139:生成AI記事の後処理

お題箱139

ちょっと前に書いた生成AIの記事に関する投稿が多く来ているのでその回です。

saize-lw.hatenablog.com

 

815.学術用語の学習(learning)についてどうしても日常語から比喩的に借用せずに造語しなければいけない(それでいてその語を業界で広く定着させられる)とすればどんな語を割り当てますか?英語でも日本語でも何語でもいいです。ちなみに私ならクラムボンを使います。

元記事に「代替ワードは特にない」とは書きましたが、訓練とかフィッティングとか(パラメタ)調整みたいな呼び方も一応あって、なんかその辺をいい感じに組み合わせて「訓調」とか呼んでもよかったのかもしれないですね。個別具体的なアルゴリズムではなくそれらを取りまとめるような射程の広いワードなので、全体としては造語でも構成要素には意味が辿れる程度の配慮があった方がよいとは思います。

 

816.学習と推論というのは圧縮と解凍とは全然別ジャンルなのでしょうか?それともその内の一つと言えるようなものなのでしょうか?「生成AIにより高い圧縮率を実現」という記事を見かけた事があるのですが、これは「圧縮のような事」という比喩のような表現なのでしょうか?

これはかなり難しい質問で、人によって答えが分かれそうですが一応僕の認識を書きます。

まず少なくともクラシカルな理論の枠組みとしては全くの別ジャンルで、学習と推論は機械学習、圧縮と解凍は符号理論のテリトリーです。とはいえ機械学習は数値列間の関係を扱う理論、符号理論は数値列の表示や変換について扱う理論であるため、かなり近くに隣接していて実質的には同じ振る舞いができることも多いです。

特に機械学習の中でも複雑な内部状態を持つニューラルネットワークでは大量の計算を介して実質的に圧縮と解凍を行えることがよく知られており、それに特化させたオートエンコーダという古典的な手法が存在するほか、エンコード・デコードという表現もカジュアルによく使われます。「生成AIにより高い圧縮率を実現」という記事も読んでみましたが、これもその類であると思われ、比喩ではなく実際に圧縮を実現していると言って差し支えないと思います。

gigazine.net

ただ、こうした使い方は「無数の画像で学習させたネットワークが、推論過程で新しい画像を圧縮・解凍する用途に使用できる」という話であって、「学習によって無数にあるデータセットの画像を圧縮し、推論によってそれぞれを解凍している」という話ではありません。たまに「生成AIはデータセットの中身を圧縮して持っている(から児童ポルノを含むデータセットで学習した生成AIは児童ポルノを含んでいる)」とか言われているのは後者の話で、そちらについてはまた別個に考える必要があります。実際にデータセット全体を圧縮して保持していることは恐らく有り得ない一方(情報圧縮率が非現実的すぎるので)、外から見て部分的には情報を圧縮して保持しているかのように振る舞うことは十分に考えられ、その挙動が比喩の範疇を出ていけるのかどうかは僕にはわかりません。

 

817.生成AIについて、3次元っぽい出力についてはなんらかの規制は入れた方がいいような気がしますがどう考えていますか?

アイコラや首相に変なことをしゃべらせる動画など、前までもできたことですがそこに簡単にリーチできるのは結構問題だと考えています。
利用者や開発者の倫理観やモラルに頼るというのもいろいろな論争を見ていると正直厳しそうですし(あれが総意ではないことは理解しています)

まあそうですね。何か社会的な問題を引き起こしそうな度合いがイラストの出力よりはリアルな動画の方が大きいだろうという見込みは概ね正しそうな気はします。

とはいえ生成AIからの出力が二次元イラスト系なのか三次元リアル系なのかははっきり峻別できるものではないですし、結局は単純に出力されたもののの使い道とか影響を個別に見る方が現実的な気はします。

 

818.自分がスマホで撮影した写真をネットを通じて送り遠くの人がスマホで見れるのは標本化・量子化・符号化・変調・復号が関わっていると習いました。生成AIが行っている事はこれらと関係する部分がありますか?

これも難しい質問ですね。技術的には難しくないですが日本語が難しいです。

そもそもスマホ含むコンピュータが扱う画像は全て標本化・量子化・符号化・変調・復号などを行う前提で全てが設計されているので、生成AIも画像を扱う時点でそれらが関係するのは間違いありません。ただそれはphotoshopとかLINEスタンプとかデジタル画像が絡むもの全てが同じ事情なので、生成AIだけが強く関係しているわけでもないです。

これは「カレーのレシピに風力発電は関係しているのか」みたいな質問に近くて、まあ農業とかを介して関係してると言えばしてるけど、カレーを作る人が皆意識してることはまずないし、とはいえSDGsなカレー作りとかで意識する人も一定数はいるだろうなみたいな感じです。

 

819.生成AIを巡る議論の誤解を解くために記事を書かれたはずなのに、反対派の人に全く理解されていないどころか、思い切り馬鹿扱いされていて居た堪れない気持ちになりました。頑張ってください。

ありがとうございます。

文章をどう読んで何を言うかはその人の自由なので何でもよいです。また、お題箱への投稿に答えるという体裁の都合上、記事冒頭で生成AI反対派のツイートを完全に否定するところからスタートしてしまったので、そこが反対派閥の人にとっては敵認定のフィルターになってしまったところも確実にあると感じます。

今回に限ったことでもありませんが、議論用の脳内メモリを1bitしか確保していないので敵or味方以上の情報量を扱えない方が世の中に少なくないことは何度かのバズを経て既に重々承知していて、そういう層までフォローすることはもう諦めています。

 

820.法学で用いられる善意という専門用語が、異なる意味を持つ日常語の善意と一致している事って「たまたま」なのでしょうか?必然的に一致した訳ではないのでしょうか?

歴史的な経緯については確認していないのでその文脈では不明です。

いま辞書を引けば異なる内容が同じ字で表されていることを偶然にも発見するだろうという程度のニュアンスで「たまたま」と表現しましたが、わざわざ一致するような一定の経緯はあったかもしれませんし、恐らく実際あるでしょうね。

 

821.『AIの文脈で使用される「学習」という言葉は機械学習分野の学術用語で、日常語の「学習」とは異なります』というのは『青魔道士の言う「ラーニング」とはモンスターのアクションを観察し青魔法として修得する技能の事を指し日常語の「ラーニング」とは異なります』のような事でしょうか?

そうです。ゲーム用語もたまに独自の意味を強く含んでいることがあって難しいですね(特にカードゲームなど)。

 

 

何か買ってもらえると嬉しいです。

www.amazon.jp