ずっと前から機材もそろえてYouTubeをはじめる準備をしていたのですが、ようやくはじめることができました。しかし、全く準備した機材は使いませんでした。このニュースレターの延長線上として、ほぼすべて生成AIでつくりました。
最初に金曜日のYouTubeショートをリリースして、次に土曜日のYouTube本編をリリースしました。しかし、作った順番は本編が先で、次にYouTubeショートを作りました。そのため、先にリリースしたYouTubeショートのほうが何となくこなれてるのではないかと思います。もちろん、YouTubeの動画をすべて生成AIで作ることはできません。素材を作るだけです。生成AIで作った素材をAdobeのPremier Proで最終的にはまとめました。✔チャネル登録と👍高評価をぜひお願いします。
動画生成のコツ
この「こなれ感」はどこに現れているかといえば、動画ですね。本編の動画はOpenAIのSoraを使ったのですが、YouTubeショートの動画はGoogleのVeo 2を使っています。使った人ならわかると思うのですが、Veo 2のほうが品質が高いです。Veo 2はGoogle AI Studioから使えます。Soraは使い物になる動画を生成するために何回もやり直しをしましたが、Veo 2ではほぼ一発で生成できました。
動画生成のプロンプトも生成AIを使います。「YouTube向けの動画を(自分のイメージ)な感じで生成したいから、プロンプト出して」みたいな感じで。プロンプトは自分で作るより、生成AIに作ってもらったほうがいいものができると思います。
音声生成のコツ
今回のキモは何といっても音声の生成でしょう。これは当然ながらNotebookLMの音声概要で生成しています。これにもやっぱりコツがあって、元データをマークダウンで書くことです。ちゃんともデータが章だてになっていて論理的に構成されていたほうが、NotebookLMの音声概要もこちらが思うとおりに音声で解説をしてくれます。マークダウンファイルはObsidianで作っています。
本当は自分がちゃんと顔出ししてその週のニュースを解説する予定だったんですよ。そのための準備もちゃんとしていた。なんならいつかはちゃんとやりたいと思っています。でもNotebookLMが優秀すぎるんです。ボクみたいな素人だと「あー」とか「えー」とかつい出てしまう。そうすると編集しないといけない。だったら、まずはNotebookLMで出してしまおう。そうなりました。
なんとなくまとめ
最近はGoogleのAIを使う頻度が非常に高いです。一時期は文書生成ならClaudeのほうがよかったし、ChatGPTも悪くなかったですが、いっきにGoogleが抜き去っていった印象です。画像生成だけはChatGPT Imagesがまだ一日の長があり、Google Imagenよりだいぶいいです。Imagenは一昔前のDALL-E3レベルですね。
生成AIはかなり良くなってきたものの、完成系からは程遠いと思います。まだまだ競争の余地はあるでしょう。ぜひ、ほかのプレイヤーの方々も奮起してキャッチアップしていただきたいところです。
いつもニュースレターを楽しみにしています。
NotebookLMの音声にあるCustomizeで次のような指定をすると音声に効いてくれます。こういうこともできます、というご紹介で、フィラーなどがあっても全然いいと思います。
フィラーをなくしてください。
”ふむふむ”という相槌をなくしてください。
最後に聴衆に問いかけをするのをやめてください。
なお関西弁でとかの指示はほとんど効果ありませんでした。
で、Google AI StudioのNative Speech Generationを使うと、関西弁もそこまで違和感ない形で反映してくれました。音声も選べます。Sonet4でシナリオを作ったのですが、ボケとツッコミも個人的にはアリなレベルでした。これもNotebookLMの音声を否定するものではありません。