【AIエンジニア必見】Midjourneyを使って「スターウォーズの世界のスターバックスコーヒー」を生成してみた

本ブログは、Discord上で動作する画像生成ツール、Midjourneyの使い方を詳しく説明します。「スターウォーズの世界のスターバックスコーヒー」の画像の生成を例に、画像生成方法から、プロンプトやパラメータの使用方法、メニューボタンの使い方などを具体的に解説します。
はじめに
Midjourneyは、テキストから画像を生成するAIサービスです。テキストは、単語でも文章でもOKで、生成したい絵のイメージやキーワードを打ち込むことで、そのイメージに沿った画像を作れます。Midjourneyの利用は、ブログ執筆時では課金プランへの加入が必要不可欠です。下記図は各課金プランの月額料金の一覧です。
引用:https://www.midjourney.com/

画像生成のやり方
MidjourneyはDiscordというチャットアプリを利用して画像生成を行います。新規ユーザーの方はこちらからDiscrodにログインしMidjourneyのサーバにアクセスしてください。
諸々登録が完了すると、下記図のようにDiscord内のMidjourneyチャネルが閲覧できるようになります。たくさんのチャネルがありますが、画像生成で使用するチャネルは「newbites-<数字>」とあるチャネルです。これらのチャネルであれば基本的にどのチャネルでも利用できます。今回は「newbites-57」で生成を行っていきます。トーク画面を開き①のメッセージ入力箇所に「/」を入力してください。そうするとこのチャネル内で使えるチャネルコマンドがいくつか出てきます。その中から②の「/imagine」を選択してください。
すると、下記図の③のように「prompt」と書かれた入力フォームが出てきます。ここにプロンプトを入力します。今回は「スターウォーズの世界のスターバックスコーヒー」を生成したいので下記のようなプロンプトを入力します。
Starbucks in the World of Star Wars, Unreal Engine, Best quality, 8k, --v 5 --quality 2
「Starbucks in the World of Star Wars」以降のプロンプトは生成する画像のクオリティを制御するためのものです。「Unreal Engine, Best quality, 8k」は公式が出しているものではないですが、入れておくと高解像度の画像を生成してくれます。「–v 5 –quality 2」は公式が定めるちゃんとしたMidjourneyのパラメータです。「—v」では画像生成で使用するモデルのバージョンを設定します。本ブログ執筆時の最新バージョンがversion 5のため今回は「—v 5」とすることで最新バージョンのモデルで生成する設定をしています。「–quality」では画像生成のレンダリングの品質を設定するためのパラメータです。「.25, .5, ,1, 2」から選ぶことができます(デフォルトは1です)。この数字を大きくすると、生成時間はかかるが高品質の画像を生成できます。一方、数字を小さくすると品質は下がってしまう反面、生成時間が高速化されます。今回はクオリティ優先で生成したいので-「-quality 2」とします。

これらのプロンプトを送信すると下記図④のように生成が開始します。

生成が完了すると下記図の⑤のように出力されます。

Midjourneyでは一回の生成で4種類の画像を生成してくれます。下記図では構図や雰囲気の違う画像が4枚出力されています。そして、画像の下には⑥〜⑧のようなメニューバーが一緒に出力されます。⑥の「U○」では指定の画像を高解像度で生成し直してくれます。数字部分は下記画像を参照してください。⑦の「V○」では指定の画像に似た雰囲気、構図の他のバリエーションの画像を生成し直してくれます。この中にイメージしていた画像が全くない場合、⑧のボタンを押すことで4種類の画像を再度生成し直してくれます。

下記図は、先ほどのメニューで「V3」を選択した時の出力です。どれも雰囲気や構図は似ていますが細かい箇所が違うのがわかります。この中の左下の画像が気に入ったので「U3」を選択し、高解像度な画像を生成します。

下記図は、先ほど選択した画像の高解像度バージョンです。この画像の上下左右、ヒキヨリ具合を調整したい場合は、下部のボタンを使って調整してください。

こちらが今回生成した画像です。店舗の雰囲気がスターウォーズの近未来感を出しつつ、スタバの木目調のデザインが上手く調和していて面白いですね。お客さんがストームトルーパーなのもシュールですね。

色んな映画の世界のスタバを生成してみた
ハリーポッター
不思議の国のアリス
チャーリーとチョコレート工場
千と千尋の神隠し
ジュラシックパーク
どれも各映画の雰囲気とスターバックスのイメージカラーの緑を汲み取れていて面白いですね!
おわりに
今回はMidjourneyを使った画像生成のやり方を紹介しました。前回紹介したStable Diffusionよりも簡単に画像生成できる点が魅力です。皆様もぜひ活用してみてください。
【AIエンジニア必見】Stable Diffusion web UIをGoogle Colaboratoryで環境構築してみた | Data Driven Knowledgebase