気ままな独り言

【初心者向け】AI技術を活用して、入力テキストから「ショート動画(手話)」を作成

今まで、「オリジナル動画」から、「短い動画」を切り出して、それに「テキストや音声・音楽」を追加して、「ショート動画」を作成していました。ただ、適切な「オリジナル動画」が無い事も多いので、AI技術を活用して、入力テキスト(プロンプト、呪文)から「ショート動画(手話)」を作成しました。初心者向けに、具体的な方法をご紹介です。

雲くん
雲くん
AI技術の進歩は、物凄いと実感しました。

・本記事を活用したショート動画「手話を一緒に勉強しませんか。本ショート動画の最終目標は、「虹(菅田将暉)」が手話で歌える様になる事です(^^)」です。ご参考です。

今までの「ショート動画」の作成方法

いままでの「ショート動画」の作成方法です。関連記事「【ブログ】初心者向けの簡単・無料のVITA動画編集アプリ説明(基本操作/応用操作)」で記載ですが、「VITA」スマホアプリを使用中です。「オリジナル動画」から、「短い動画」を切り出して、それに「テキストや音声・音楽」を追加して、「ショート動画」を作成です。

・ただ、適切な「オリジナル動画」が無いので、AI技術を活用しようと考えました。具体的には、「手話動画」です。

<方法A>入力テキスト(プロンプト、呪文)から「ショート動画(手話)」を作成

AI技術を活用して、入力テキスト(プロンプト、呪文)から「ショート動画(手話)」を作成にトライしました。なお、参考記事「【徹底解説】Pika Labsで動画を生成!簡単にAIで一枚の画像から動画を作成する方法」も参考にさせて頂きました。
・ただ、後述「方法B」が優れているので、「方法A」は、読み飛ばして頂いても、大丈夫です。

「Pika Labs」は、AI技術を活用して静止画から動画を生成することができる画期的な動画生成AIツールです。

(参考情報)
なお、「【OpenAI Soraの動画事例】一晩で世界を変えた動画生成AIのヤバい使い方10選、2024年2月22日」に記載の「④クリエイティブ動画の作成」が、やりたい事に近いのですが、一般公開が先なので、避けました。

<OpenAI、動画生成AIの「Sora」をリリース>
⚫︎超高品質のAI動画がテキストから生成できる ⚫︎Gen-2などでは16秒しか作れなかったAI動画が60秒も作れる ⚫︎Youtubeショート、Instagram、TikTokで活用法は無限 ⚫︎ユーザーが使える日程はまだ未定

⓪準備

「⓪準備」です。「Pika Labsのウェブサイトにアクセス」に、ログインします。なお、「Pika LabsはDiscord上で動作するため、ユーザーはDiscordにログインし、Pika Labsのサーバーに参加する必要があります」との事なので、「Googleログイン」では無く、黄色の「Discordログイン」とします。
・ちなみに、「Discord(ディスコード)とはどんなアプリ?」に記載ですが、「Discordは“みんなが居場所を見つけられる空間を”というコンセプトで作られたコミュニケーションサービス」との事です。2枚目で示す様に、最下部の「Discordアカウント登録」を行います。初回アクセスですが、「おかえりなさい!」には、少し驚きました(笑)。

  

「Discordアカウント登録」後に、「Discordサイト」にアクセスして、「Pika」クリックで、以下のパソコン画面になるはずです。なお、パソコン画面の左下に白抜き箇所に、自分の「Discordアカウント」が表示されます。これで、成功です。

①使用する静止画像を準備します

まずは、「ChatGPT」で、以下の様に入力すると、英語のプロンプトが作成されます。

AIを使用して画像生成を行います。内容は、「若い女性が、手話で、誰かに、朝の挨拶をする様子。場所は、緑色の草原。時間は、昼間。」です。以上の画像を生成するためのプロンプトを英語で、提示してください。
ChatGPT
Generate an image of a young woman using sign language to greet someone with a morning salutation

<「画像生成AI_Midjourney」が、無料から有料へ改悪でした>
・「画像生成AI_Midjourney」で、「beta版」をクリックすると、Discordに招待されるので、承認します。以下のパソコン画面になります。ただ、プロンプトを送信後に、画像が生成されるはずが、上記の参考記事では、「無料」だったのが、「有料(1年契約で、8ドル/月)」になっていました。「無料」で無いので、使用を避けました。

  

<無料「Stable Diffusion」で、静止画像を作成>
・他の無料版の画像生成AIを探しました。「DALL·E 2とは?使い方・料金・使いこなすコツを徹底解説!Midjourney・Stable Diffusionとの違いとは?」を参考にしました。結論として、「DALL·E 2:基本的に有料のクレジットが必要」、「Midjourney:月額プラン」、「Stable Diffusion:無料で利用可能で、利用回数に制限はありません」から、最後の「Stable Diffusion」を選択しました。「【超初心者向け】Stable Diffusionの使い方完全ガイド」を参考にします。「Stable Diffusion AI画像ジェネレーター」でトライしました。
・例えば、左上の元画像に、それぞれのプロンプト(実際には英訳後)すると、変化します。男性アイコンですが、女性アイコンにもなる事が驚きでした。実際に使用したのは、2枚目です。なお、クレジット制になっており、10回まで無料でした。

  

②準備した静止画をショート動画にする

Discordサイト」にアクセスします。Pikaを選択して、どれかのチャットルームで、以下の様に、「/create」と入力後、プロンプト文(英語)をコピペして、下部の「他1」をクリックすると、丈夫に「image」箇所が出現するので、「準備した静止画」をアップローとして、しばし待ちます(数分)。

AIを使用して画像生成を行います。内容は、「若い女性が、手話で、誰かに、朝の挨拶をする様子。時間は、昼間。そして、右手の平を自分の前で胸の高さに持ちます。」です。以上の画像を生成するためのプロンプトを英語で、提示してください。
ChatGPT
Generate an image of a young woman in a daytime setting, signing a morning greeting in sign language to someone off-camera. She holds her right hand palm facing towards herself at chest height.


・他の方が使用するので、どんどんとチェットルームが流れていきますが、自分の「Discordアカウント」に、動画が出来ていました。ただ、3秒間だけと短いです。加えて、右手を上げてほしかったのですが、ピクリとも動きません。残念です。何故か、顔を別人になります。う~ん、

・では、指の数を変えてみます。しかし、指の数は変わらずに、目が大きくなっただけでした。要するに、思い通りに、動いてくれませんでした。

AIを使用して画像生成を行います。内容は、「若い女性の指が、5本から2本になっていきます。」。以上の画像を生成するためのプロンプトを英語で、提示してください。
ChatGPT
Generate an image where the fingers of a young woman transition from five to two.

<方法B>数枚の静止画を作成して、「ショート動画」にする

一旦、手話レベルの動画の作成を諦めて、数枚の静止画を作成して、「ショート動画」にしてみます。「【画像生成機能】ChatGPT「DALL-E 3(DALLE3)」使い方~応用裏技紹介」が参考になります。

「Bing Image Creator」を活用して、「静止画」を作成トライ

リンク先「Bing Image Creator」を活用して、「静止画」を作成します。記事「【第12回】Microsoft Bing Image Creator使ってみた~アイコンをAIで作ってみる~」も参考にしました。
・例えば、以下の英文を入力します。候補が3つあり、ほぼプロンプト通りの画像になりました。安心しました。あとは、プロンプトを修正して、理想状態に近づけます。次の日に、同一プロンプトでトライしましたが、異なる画像になりました。毎回、変化する様です。

AIを使用して画像生成を行います。内容は、「若い女性が、手話で、誰かに、朝の挨拶をする様子。時間は、昼間。そして、右手の平を自分の前で胸の高さに持ちます。」です。以上の画像を生成するためのプロンプトを英語で、提示してください。
ChatGPT
Generate an image of a young woman in a daytime setting, signing a morning greeting in sign language to someone off-camera. She holds her right hand palm facing towards herself at chest height.
  

・使用中に気になるモノが、パソコン画面の右上「ブースト」です。最初は、25個が与えられるが、次からは、「リワード500(50円)=ブースト5個」と引き換えです。「Microsoft のRewards(リワード)について」に、リワードの貯め方が記載です。「ブースト」をしないと処理時間が長くかかる様ですが、その差は、未確認です。

・加えて、文字入力も可能です。2枚目で、「Fun Fun!」と画像に追加してみました。デザインされた様に、センス良く入り込みました。ただ、手話の「文字」にしたい場合は、画像に、別途「テキスト」追加した方が、目立つと思います。

Man riding a bicycle around the sun
Man riding a bicycle around the sun with “Fun Fun!”
  

<ご参考>
・「ChatGPT」の有償版では、以下の追加機能もある様です。便利ですが、「有償」なので、避けました。

ChatGPT」の有償版では、「DALL-E 3(DALLE3)」がその中で使える様で、すごく便利です。加えて、「gen_id」とは、DALL-E 3で生成された画像に、固有のIDを付与する機能です。この機能により、DALL-E 3で生成された画像を簡単に管理や共有ができるようになりました。

「Bing Image Creator」を活用して、本格的に「静止画」を作成して、「ショート動画」に

では、本格的に「数枚の静止画」を作成します。1枚目の手話が「私」で、2枚目の手話が「思う」です。「Google翻訳」で、何回かのトライで、想定した「静止画」になりました。「Bing Image Creator」では、日本語プロンプトとの事なので、融通性が高いです。ただ、手話では正確性を求めるので、英語プロンプトが良いそうなので、「日本語→英語」翻訳を行いました。なお、前述では、「ChatGPT」を使用していましたが、その必要性は無さそうです。
・なお、2枚目は、「自分のこめかみに当てる」としましたが、ピストルっぽくなったので、避けて、「自分のこめかみに優しく当てる」と「優しく」追加で、自然になりました。

赤い服を着た若い白人の女性が、右手の人差し指を、自分の鼻に優しく当てる
A young Caucasian woman dressed in red gently places her right index finger on her nose
赤い服を着た若い白人の女性が、右手の人差し指を、自分のこめかみに優しく当てる
A young Caucasian woman dressed in red gently places her right index finger on her temple.
  

・いい感じの「私」「思う」の「静止画」2枚が出来たので、関連記事「【ブログ】初心者向けの簡単・無料のイラスト動画(基本操作、FireAlpaca推薦)」に沿って、「ショート動画」にします(以下の枠内に概要記載です)。ただ、最近は、動画編集「CapCut(キャップカット)」で、「静止画の3秒間」を組み合わせて、「ショート動画」にしています。冒頭の「ショート動画」もそれで簡単に作成しました。

・「数枚の静止画」→「ショート動画」は、「CapCut(キャップカット)」をスマートフォンアプリで使用しました。「CapCut(キャップカット)とは?基本的な機能・使い方を解説」が参考になります。

■その後
・その後に、他の「静止画」作成方法も探していましたが、「Microsoft Designer」も無料でした。クレジット性でも無いので、安心でした。また、日本語も使用可能です。手話で「泣く」がうまく作成できました。

首元まである赤いシャツを着た髪が長い若い白人の女性が、眼を開けて、こちらを見ながら、片手で無く、地面と水平方向にして、揃えた両手の先で、眼元に触れている。
A young Caucasian woman with long hair, wearing a neck-length red shirt, opened her eyes, looked at me, and touched her eyes with the tips of her hands, not with one hand, but with the tips of her hands parallel to the ground.

AI技術を活用して、テキストから「ショート動画(手話)」作成<ポイント

AI技術を活用して、テキストから「ショート動画(手話)」作成する際の、ポイントです。最初に、うまく行かない「方法A」です。

■うまく行かない「方法A」
・「Pika Labs」は、AI技術を活用して静止画から動画を生成することができる画期的な動画生成AIツールなので、トライしました。
・「Stable Diffusion」で、良さそうな静止画が出来たので、「テキスト」から、AI技術を活用して、その静止画を「Pika Labs」で動かそうとしましたが、思うように行きません。
・手話であれば、手の動きを正確に「テキスト化」する必要がありますが、非常に難易度が高いと判断しました。「花火が瞬く」程度であれば、可能なのですが…

以下が、うまく行った「方法B」です。ただ、手話レベルと求めた結果であり、「花火が瞬く」程度であれば、「方法A」も選択可能です。

■うまく行った「方法B」
「テキスト」から、AI技術を活用して、数枚の静止画を、リンク先「Bing Image Creator」を活用して、作成します。
・その静止画を、「パラパラ漫画のGIFファイル」にした後に、「GIFファイルをMP4ファイルに変換」すれば、「ショート動画」が完成です。

まとめ

AI技術を活用して、入力テキスト(プロンプト、呪文)から「ショート動画(手話)」を作成しました。初心者向けに、具体的な方法をご紹介です。
・要するに、手話レベルで、「良さそうな静止画を、テキストから、AI技術活用で、うまくショート動画にする」のは、非常に難易度が高いです。従って、テキストから、AI技術を活用して、「数枚の静止画」を作成し、それを「GIFファイル→MP4ファイル」で「ショート動画」にするのが、現実的です。

皆さんのご参考まで(^^) 何かあれば、お気軽にお問い合わせください。

2024年2月25日

関連記事

本記事で紹介した関連記事「【ブログ】初心者向けの簡単・無料のイラスト動画(基本操作、FireAlpaca推薦)

上記も含めた、本ブログの「気ままな独り言」カテゴリー(水槽、ブログ、仕事、猫と人間など)の記事リスト(約30件)です。他の記事も、どうぞ。
・各記事の左上に「検索窓」があるので、気になるキーワードを入れて頂ければ、ご要望の記事があるかもしれません。

【記事リスト】「気ままな独り言」カテゴリー(水槽関連、ブログ関連、仕事、猫と人間)本ブログ「大丈夫だよblog」の「気ままな独り言」カテゴリー(水槽関連、ブログ関連、仕事、猫と人間)の記事リストです。グループ別に記載してあります。...
ABOUT ME
雲(関西人)です。DIY(猫モノ、バラフェンス、野菜/果物、格子戸)、お金と時間の節約(ネットワーク関連、自動車関連、購入/料金と修理、確定申告/税金/年金、メルカリ活用)、独り言(水槽、ブログ、仕事、猫と人間)を中心に、オリジナルな視点で、生活の知恵を書きたいと思います。 ・何かあれば、お問い合わせください。励みになりますので… 今後とも、よろしくお願い致します。Instagram(ユーザーネーム: shimaishitsupo)も、私なので、こちらも、どうぞ。