2023.08.02

Midjourney（ミッドジャーニー）を使って、複数枚（最大5枚）の画像を合成してみる

こんにちは。木村です。

今回はAI画像生成ツールである「Midjourney（ミッドジャーニー）」を使ってみます。

簡単な「Midjourney」の使い方から、今回のテーマである複数画像の合成を試してみました。

「Midjourney」とは？

「Midjourney」を簡単に説明すると、テキストから画像を生成するAIサービスです。

チャットをするようにテキストを打ち込むだけで画像を生成できます。

あと「Midjourney」の詳細については、紹介してくれているサイトが沢山あるので、そこを当たっていただければと思います。

以前であれば無料プランでも画像の生成ができたようですが、現在は有料プランのみ生成が可能です。

支払い方法は、クレジットカードとAlipayのみ。

もし、トラブルが心配な方は「Vプリカ」みたいなクレジットカードと同じ用に使えるプリペイドカードで試してみるのもいいと思います。

今回やりたいこと

実は今回は一つやってみたいことがあります。

それは･･･

「当社の社屋（宮ノ前ベース）の前で、

　夜、ストレッチテントを張って、

　いい雰囲気でパーティをしている。」

そんな、画像を生成します。

（※ストレッチテントについては後から画像がでてきますので、とりあえず読み進めてみてください）

↓これが「宮ノ前ベース」ね。

「なぜそのような画像を作成したいのか？」は、話すと長くなりますので、今回割愛させてください。笑

一旦、気にせずこのブログを見守ってください。

さて、うまく生成できるのでしょうか？

チャレンジしてみたいと思います！

まずは軽く使ってみる

さて、本題に入る前に簡単な使い方の紹介も兼ねて「Midjourney」を使ってみます。

まず「Midjourney」にログイン後、まずは初心者部屋に入ります。

この左側にある「newbies-○○」のどれかをクリックして、ルームへ入ります。

画面一番下の「newbies-○○へメッセージを送信する」のテキストボックスに、コマンドを入力します。

【入力方法】

①「/imagin」と入力し、Enter。

　→入力途中でも、候補が表示されるので、それをクリックでもOK。

②「/imagine prompt」と表示されるので、この後にカンマ区切りで、テキストを入力し（呪文ともいうらしい）、Enter。

テキストは日本語でも可能らしいですが、英語のほうが精度が高いため、英語で指定します。

英語は苦手なので翻訳サイトを利用します。

（今回はDeepLを使っていますが、Google翻訳とか、なんでもいいと思います。）

さて、試しに以下のようなキーワードにしてみます。

（原文）「緑茶が大好きなトイプードル, スタジオジブリ風」

（翻訳）「Toy poodle that loves green tea, Studio Ghibli style」

入力完了したので、早速いってみます。

（ちょっとドキドキ）

いざEnter！

コマンドが送信され、「Waiting to start」となっています。

しばらく待ちます…。

そして…（1分もしないかな？）

お、

おぉぅぅぅぅううっ、、、

こ、これが、緑茶大好きトイプさん！

（スタジオジブリ風は無視された感じ？難しい）

とまあ、こんな感じで生成できてしまいまいました。

さて、本題です

当社の社屋「宮ノ前ベース」と「ストレッチテントを張ってパーティしている風景」を合成させるのですが、後者の画像がありません。

せっかくなので、「ストレッチテントを張ってパーティしている風景」も「Midjourney」に生成してもらおうと思います。

まずはこのキーワードで生成してみます。

（原文）
ストレッチテントを張ってパーティ, 賑やか,フェスのよう, 夜, 大勢の人, 照明が美しい, 遠景

（翻訳）
Party with stretch tent, lively, festival like, night, big crowd, beautiful lighting, distant view

そして、できたのがこれ↓

おぉ、きれいなのができました。

（※これがストレッチテント）

が、うーん、

もうちょっとローアングルの画像が欲しいですね。

再度「ローアングル」のキーワードを入れて、指示し直してみます。

（原文）
ストレッチテントを張ってパーティ, 賑やか,フェスのよう, 夜, 大勢の人, 照明が美しい, 遠景, ローアングル

（翻訳）
Party with stretch tent, lively, festival like, night, big crowd, beautiful lighting, distant view, low angle

↓できたのがこれ