週末の独り言:🧠人間の考える力はやっぱりスゴイ
AGIはまだまだ当分来ないという話。人間の考える力でAIのパフォーマンスが決まる。一番大事なのはAIの性能ではなく、その能力を引き出す人間の「考える力」。AIの能力を最大限に引き出すためにも、ボクたちはいっぱいAIを使ったほうがいい。
相変わらずYouTube動画を作るのにハマっています(カタパルトスープレックスのYouTubeチャネルはこちら)。前回、5月24日に書いた記事からかなりやり方も変わって、さらに効率的に動画を作ることができるようになりました。
具体的には動画生成はVeo 2から代わってRunway Gen4がメインになりました。音声生成はNotebookLMから代わってGemini speech generationを使うようになりました。台本作りはいろいろ試しましたが、いまはClaude Sonnet 4で定着しました。変わっていないのは動画のベースとなる画像を作るChatGPTくらいでしょうか。やはり、自分の手を動かして試行錯誤するのは大事ですね。人間の最適化能力ってやっぱスゴイ。
人間の最適化能力の根源って「考える」ことなんだとおもうんですよね。AIには「意識」がないので、人間のように自律的に「考える」ことができない。いまはない、この「意識=自律的に考える力」をAIが獲得したらAGIになるといわれています。その「意識」をもつ手前にあるのが「推論」なのではないかとも言われています。だから、推論がすごく流行っています。
しかし、6月13日のニュースレターでも紹介しましたが、Appleが、いま世の中に出ている推論AIは実は推論なんてしていないのではないか、という研究結果を公表しました。このAppleの研究結果は、ボクがいろんなAIを使って感じることとも一致したりする。なんか考えてるっぽいことを表示してるけど、お前ら実は考えてないだろ?と。あれって、「考えている風なギミック」なんじゃないかと疑っている。
いま、アダム・ベッカーの”More Everything Forever”という本を読んでいるのですが(そのうち書評を書きます)、ここでも「AIの出力するものは結局すべてハルシネーションでしかない」と書かれていて、妙に納得してしまいました。様々な情報の集合体から計算と確率で文字を繋げていっているだけ。人間のように「考えている」わけではないので、生成されたものはその計算の結果でしかない。人間が正解と思おうが、思うまいが、AIにとっては計算の結果でしかない。人間にとって間違っていれば「ハルシネーション」と呼ばれるだけ。
ちょっと話はそれてしまうのですが、もしAIの出力結果がすべてハルシネーションなのだとしたら、AI検索って実はそこまで流行らない気がする。GoogleのAI Modeとか、PerplexityとかChatGPT Searchとか。ハルシネーションを完全に避けることはできないのだから。検索で求めるのは正確性だとおもうのですよね。「〇〇とは?」みたいな簡単な検索だったら、AI検索のほうが便利だとは思う。SEO的に言えばKnowクエリですね。でも、そこから何かアクションをしなければいけない場合(SEO的にはDoクエリやBuyクエリ)、AI検索はちょっと信用できない。OpenAIはChatGPTにショッピング機能を作ってBuyクエリも獲得しようとしていますけどね。
AIは特定の分野においては、確かに人間をはるかに上回るパフォーマンスを発揮します。AIの力がなければこのニュースレターを続けることも、YouTubeの動画を作り続けることもできません。先ほどのSEOの話で言えば、KnowクエリはAIが得意なところだし。DeepResearchはKnowクエリを突き詰めた機能だと思います。そして、AI検索はGoクエリも実はとても得意です。一般的に、どこかに行く場合はGoogle Mapを使うことが多いと思いますが、細かな道や場所はGoogle Mapでは分かりにくい。例えばバス停の場所とか。そういう時にChatGPTとか使うと、道順を丁寧に教えてくれたりします。
しかしながら、AIの力を発揮させるのはやはり人間だとも思います。いつ、どのような場面で、どんなAIをどのように使うのか。AIのパフォーマンスは人間の想像力次第(つまり考える力)だと思うんです。たとえば動画生成において、AIには明確に不得意な分野があります。人間の考える構図通りに動画を生成することは難しいです。カメラを固定して、ズームもパンもしないようにと指示しても、ほぼ無理です。よく、AIが生成したスゴイ動画が公開されたりしますが、あれは偶然の産物でしかありません。ランダムに数秒間のスゴイ動画が作れても、それで映画にはなりません。人間がスゴイのは、AIが苦手な部分を理解したうえで、いろいろ考えて工夫してAIが生成しやすい動画を作ることができること。だんだんわかってくる。あ、これだったら作れるな、これはダメだなって。
サム・アルトマンとかダリオ・アモデイのようなAI企業のトップは「AGIはもうすぐ」みたいなメッセージを出します。まあ、立場的にそう言わなければいけないのは理解できなくもない。でも、ボクは思うわけです。絶体無理だろって。少なくとも今のAIの延長線上にAGIがあるとはとても思えない。
ちなみに、今回の画像はいつものChatGPT Imageではなく、GeminiからImagen 4を使って作ってみました。いつもとちょっとテイストが違いますよね。ベルエポック風に現代のカフェを描いてもらいました。これももう少し違う構図で、もうちょっとくすんだ感じにしたかったんですけどねえ。