自社の年賀状用画像を、画像生成AI「Stable Diffusion」で作ってみた

自社の年賀状用画像を、画像生成AI「Stable Diffusion」で作ってみた
目次
画像生成AIを使って、年賀状用画像を生成しよう。そこまでは良かったが…
夏から秋にかけていくつもの画像生成系AIが公開され、話題になっていましたよね。そんな頃、社内では「画像生成AIを使って会社用の年賀状画像を生成してみたら面白いのでは?」という声があって。弊社は現在、AIを使ったデータ分析を業務で行っているので、会社のコンセプトとも合致するため、実施することが決まりました。
生成に使うAIは、たくさんの候補の中からStable Diffusionを選びました。選定の理由は、弊社・山窪さんが過去に使用経験があるという面が強かったです。Stable Diffusionも競合の画像生成AIと同じく単語プロンプト(英文)を与えると画像を生成してくれるのですが、最初に検証したのは「どういうプロンプトを入力すると、どういう画像が生成されるのか」を調査するところから始めました。
今回使用したStable DiffusionはWebサイト上で公開されているものではなく、Vertex AI内の「ワークベンチ」と呼ばれる仮想環境上で動作させました。こうすることで乱数シードを固定できるため、同じ単語プロンプトを入力した際に同じ画像を安定して生成させられることと、Web上のサービスに較べて生成スピードが圧倒的に早いからです。
こうして、100枚生成させた中から「一番イメージに近い」と感じたものの乱数シードまたは単語プロンプトを変える…という手法で、目的の画像へ近づけていったのです。
生成する画像は年賀状という用途が決まっているものなので、何でもいいわけではありません。年賀状用画像なので「新しさ」を求めて、現在上映中の映画『アバター:ウェイ・オブ・ウォーター』や『すずめの戸締まり』というキーワードでの画像生成も試してみましたが、rabbit+『アバター』はグロ画像に。rabbit+『すずめの戸締まり』は、どうしてもウサギが生成されず、人物イラストのみになってしまいました。
その後、SFなどの単語でも生成テストを実施。どれもレベルは高いのですが、年賀状「らしくない」。これが、最初にぶつかった壁でした。

画家の名前を含めて、タッチを真似てもらってみたら…?
画像生成AIは、単語から画像を作れるという革新的な技術です。でも、作り手側が「どんな画像を作りたいか」というイメージがなければ、目的の画像が作れるわけがないということに気付いたのです。
そこで社内メンバーに相談したところ、「水墨画はお洒落でいいのでは?」という意見があり、トライしてみました。
画像生成AIはプロンプトに画家の作家名を含めると、その人のタッチを真似してくれます。そこで水墨画家「雪舟」の名前をプロンプトに含めた画像を生成したところ、かなり自分のイメージに近い画像が生成されました。れを自信満々で弊社・一筆社長にプレゼンしに行ったところ…。
「これ、喪中用のイラストだよ」
ごもっともです…。

「琳派・伊藤若冲」のタッチで生成させてみると、まさかの…
ここでタッチの選定に悩んでいたところ、社内から出た意見は「歌舞伎」や、浮世絵師「葛飾北斎」といった単語です。
確かに年賀状ですし、お正月なので、富士山や日の出といった要素も欲しい。構成要素としては、背景に富士山があって、日の出の要素を入れて、そこにウサギがいるという内容にしようと。
さらに、タッチは弊社・一筆社長が好きな「琳派・伊藤若冲」にしようという話に。私は「若冲」という作家名は初耳だったんですが、18世紀に活躍された日本絵画家さんとのこと。
※一筆社長以外、社内で誰も「若冲」という名前を知りませんでした…
さらに、歌舞伎のような明るい色合いを使って生成しようという辺りで、完成形の方向性が固まったのです。500枚ほど生成し、この方向性にしようということになりました。
でもこの画像、「rabbit」もキーワードに含めたんですが、ウサギが消えてるんですよね。そこで、ウサギだけを別途生成し、シルエットになっている山に合わせてウサギのシルエットをAdobe Photoshopで合成し、自信満々で弊社・一筆社長にプレゼン。
「ウサギ要素低いね」
ごもっともです…

キーワードに「rabbit」を含めても、どうしてもウサギが出ない。よろしい、ならば合成だ
しかし、背景のタッチについてはこの方向性で行こうというところまではFIX。新たな背景を生成し、下に掲載した画像で確定。あとは、「この背景に合うタッチのウサギ」を合成するというフェイズへ移行しました。
しかし文字「賀正」を配置しようとしてみると、年賀状「らしさ」を出すためには縦書きで書きたい。縦書きである以上、視線誘導は右上を起点にしたいが、そこに松のシルエットがあって邪魔。というわけで、背景の左右を反転し、「賀正」の文字をレイアウトするスペースを作ることにしました。
最後は、このタッチに合わせたウサギのイラストを生成するだけです。もう一息!

ウサギ画像の切り抜きにもAIアルゴリズムを利用し、ようやく完成
そして、背景タッチに合ったウサギ単体の画像の生成に成功。ようやく、です。
なお、生成されたウサギ画像には背景が含まれていたので、オンライン上で利用できるAIを使った「画像切抜き」サービスを利用し、ウサギ単体の素材を準備。バランス的にもう1匹、小さなウサギが欲しかったので、そちらも新規に生成し、切り抜きを行いました。
最後の微調整は、2匹のウサギの色味をPhotoshop上で揃えて配置しました。厳密に言えば2匹の体毛の色は微妙に違うのは、座っている位置が違うので光の当たり方も少し違うという解釈です。
●参考情報
環境構築:10時間弱(採用した環境の構築は数時間)
画像生成:20時間弱(生成時の待ち時間を含む)
その他:私に絵心はございません
こうして完成したAI年賀状、いかがでしたでしょうか? SiNCEは2023年も引き続き、AIやデータを使って皆様のビジネスをグロースさせるお手伝いをさせていただきます。
どうぞ良いお年をお迎えください。
