こんばんは、スタジオ真榊です。今夜はAIイラストの鬼門の一つである「破綻した手の修正」に関する大型記事です。image2imageやNegativeEmbeddings、Controlnet、LoRA、LamaCleanerなど、これまで考案されてきたさまざまな修正方法を網羅的に紹介しつつ、「①修正力の強さ」「②手軽さ」「③侵襲性(手以外への影響)」に分けて実力を検証。2023年6月現在での最適解は何かを探ってみました。
AIイラストにおける手修正の歴史
私がAIイラストに触り始めたのは2022年10月。当初はNovelAIのプロンプト研究やイラスト生成に始まり、23年1月にStableDiffusionによるローカル生成に移行、以来Controlnetなど次々に登場する技術の検証に夢中で取り組んできました。
この間実にさまざまな革新と発明が繰り返されてきましたが、いまだに手の崩壊の抜本的解決には至っていません。それほど、見る角度や握り方によって形状が複雑に変化する人間の手はAIによる表現が難しく、高精細なイラストが作れるようになるほどにAIユーザーの悩みの種となってきました。
もちろんこの間、崩壊した手をきれいに修正するべく、AIを使ったさまざまな方法が編み出されてきました。黎明期における最も単純な対策法は、おおまかに肌色で手の形を描いて、その部分だけi2iしてみる方法。次に、ローカル生成ではTextual Invarsionという追加学習方法を使って破綻を防ぐ「NegativeEmbeddings」を使う方法が流行しました。その後、Controlnetの登場によって線画レベルで手を修正したり、Openposeやdepth(深度情報)を利用して手の形を固定させる試みが勃興。最近はLamaCleanerやジェネレーティブ塗りつぶしといった技術が使われるようになり、余計な指をサッと消したり、手全体をいちから描き直してもらったりすることが簡単にできるようになりました。
次の項からは、現在ローカル生成で一般的に行われているこれらの方法について、メリット・デメリットを詳しく見ていきます。
①NegativeEmbeddings
②Depth map library
③Lineartで線画修正
④Openpose Editor
⑤「EnvyBetterHands」LoCON
⑥LoRAで手修正
⑦消しゴムマジック
- 関連記事
-