【Stable Diffusion】AIでゲームキャラ作るよ
自分が描いたキャラをAIで描いてもらうよ
開発が止まっている我がゲームの主人公である「鍛冶屋の娘」
去年自分が描いたイメージがこれなんです。キービジュアル的なものになるの。確かAffinity Designerで描いたな。
これをAI画像生成ツール「Stable Diffusion」を使って描いてもらいました。
※アプリなどへの商用利用も可能な学習モデルを使っています。ちなみに印刷物として扱うのはNGらしいので、透かしは自分で入れました。
自分の勉強不足だとおもうのですが、
画像をアップしimg to img を使えば、元画像(上の絵)に似た構図で描いてくれるものだと思っていましたが、そういうわけではなさそう。
キャラの姿勢はControlNetを使ったり、色々やらんとダメっぽい。
なので、自分がイメージしたキャラの要素を一つ一つ言語化し、text to img で描いてもらうことにしました。
同じテキストでも学習モデルが違うと全く別の仕上がりになるので(これが面白い)自分なりに学習モデルも色々と試してます。(商用利用可/不可、アニメ、2.5D、リアル)
言語化能力はAIに限らず重要
自分がイメージしていたキャラとはいえ、実際に言語化し、英語のコマンドにするのは結構難しく、なかなか思うような変化が得られないかもしれません。ただ、AIツールの良いところはリテイクが何度でも可能なこと。
まぁ、私のイメージでは、「鍛冶屋、緑の髪、ゴーグルと帽子、鍛冶屋っぽい服(?)」でしたが、鍛冶屋っぽい服をもっと細かく言語化する必要がありました。(ノースリーブ、ベルト、などなど・・・)
結果は沢山見る
出力結果には当たり外れがあるようなので、これだと思ったテキストでは数十枚出力。そうすると全体的なイメージが見えるので、もうちょいこここうしたいな。とかができます。
こちらは、#pretty25DV2_pretty25DV2Pruned
というモデルを使っています。大体イメージが出来上がったところで20枚出力し、良い感じだったので画像サイズを変えて出力、その後、少し微修正して出力。(どこが微修正されたかわかるかな?w)
2.5D絵が個人的に好きなのもあり、上記モデルを使っています。
他にも下のようなよりリアルに近い2.5Dモデルもあります。
同じテキストなんですが急に服装が簡素になり露出が増えてセクシー路線に・・・
ファンタジーを実写に近づけるのはしっくりこないですよね。アニメの実写映画化と同じ理由かも。
そんなこんなで、
この辺りがお気に入り。原型はどこに?気にしない!自分じゃ1枚作るのに10時間以上平気でかかるし、イメージを具現化するのが大切。
途中からメカニック要素を追加したりしてちょっとそっちが強い?気がつけば背景も宇宙ぽくなってる。
最後に学習モデルの備忘録
4つのモデルを試しました。
左から
- chilloutmix(リアル調、商用NG)
- muse_v1(リアル調、商用OKらしい)
- koreanstyle25D_koreanstyle25DBaked(2.5D、商用不明)
- pretty25DV2_pretty25DV2Pruned(2.5D、イラスト単体利用でなければOK)
同じ画像ベースでimg to img し、モデルだけ変えて見ると、左3つの構図がほぼ同じ。一番右だけちょっと違う感じでしたね。
自分の好きな学習モデル見つけるだけでも楽しいですね。他にも沢山あるので試してみたいです。
2.5Dのオススメモデルとかあれば教えて欲しいです!