ブログ記事を作成するときに利用する画像を選ぶのに苦労することがあります。
オリジナルな画像を作成したいのですが、いい方法は無いでしょうか?
そこで今回は画像生成AIのひとつ「Imagen 3」でオリジナルな画像を作る方法を紹介します。
驚くほどリアルでしかもオリジナリティのある画像が作れます。
画像生成用AIモデル「Imagen 3」とは?
Imagen 3は、Google DeepMindが開発した最新の画像生成AIモデルです。
2024年5月のGoogle I/Oで発表された新しいモデルです。
このモデルは、テキストから高品質でリアルな画像を生成する能力を持ち、従来の画像生成AIを超える進化を遂げています。
特に、質感や光の表現力が向上しており、ユーザーが入力した自然言語のプロンプトに基づいて、非常に詳細でリアルなビジュアルを生成することが可能です。
Imagen 3は、クリエイティブな業界において、アーティストやデザイナーが迅速にコンセプトアートやデザインモックアップを生成するための強力なツールとして期待されています。
これにより、従来の手法に比べて、アイデアの具体化が迅速に行えるようになります。
では、Imagen 3の特徴を紹介します。
高精度な画像生成
Imagen 3は、フォトリアリズムに優れた画像を生成します。
髪の毛や服の質感、光や影の自然な表現が強化されており、まるで現実を見ているかのようなリアリティを実現しています。
テキストレンダリングが向上
Imagen 3モデルは、吹き出しや文字を画像内に自然に組み込むことができ、漫画やポスター、広告のようなシーンを生成する際に特に優れています。
テキストを含む画像のレンダリングは他の生成AIには難しいとされる中で、Imagen 3はその精度の高さで注目されています。
多様なスタイルへの対応が可能
Imagen 3は、写真風の風景画から油絵、クレイアニメーションシーンまで、多彩なスタイルに対応しています。
ユーザーは話し言葉の様な自然言語でプロンプトを入力すれば、さまざまなスタイルの画像が生成できます。
高度なプロンプト理解
複雑なプロンプトでも、細部まで作り込む能力があります。
つまり、ユーザーの制作意図を正確に反映した画像を生成することができます。
これにより、クリエイティブなプロセスが大幅に効率化されます。
安全性と倫理的配慮
Imagen 3には、生成された画像に電子透かしを施すSynthID技術が組み込まれています。
そのため、商用利用の際の安全性が確保されています。
また、ユーザーが生成する画像の内容を制御できる機能も備えています。
「Imagen 3」はGeminから使える
Googleは2024年8月28日に、同社が開発したマルチモーダル生成AIモデル「Gemini」に、画像生成用AIモデルで最新の「Imagen 3」を採用しました。
Geminに指示すれば、「Imagen 3」が呼び出されて、画像を生成します。
つまり、Googleアカウントがあれば、Webブラウザから簡単に「Imagen 3」にアクセスできます。
Imagen 3は、ブラウザから利用できるサービスです。
Geminから「Imagen 3」を使う方法
まずGoogleアカウントにログインします。
次にブラウザーからGeminと入力します。
Geminのサイトが表示されるので、そこからすぐ利用できます。
画像を生成するには、Geminにプロンプト(指示)を入力します。
頭の中にあるイメージを表現するためには、プロンプトが非常に重要です。
プロンプト作成のコツは、できるだけ具体的で詳細な説明を心がけることでイメージに近い画像が生成できます。
事例として「近未来の空飛ぶ車」を「Imagen 3」に作ってもらいましょう。
プロンプトは以下の様につくりました。
「大都市の高層ビルの間を空飛ぶ車が多数移動している画像を作ってほしい。時間帯は夕方で太陽が沈むころ、たくさんの空飛ぶ車が行き来している風景です」
では、実際にプロンプトをGeminに入力してみましょう。
すると、画像を作ることだとGeminは理解して、「Imagen 3」を呼び出します。
そして、プロンプトに忠実に画像を生成し始めます。
数秒で、その画像を生成しました。
それが、下記の画像です。
このように、自然言語でGeminに指示すると、「Imagen 3」を呼び出して、プロンプトに忠実にイメージを具現化してくれます。
最新の画像生成AI「Imagen 3」がこのように利用できるのは、驚きです。
しかも無料です。
無料版のGeminからは「人間」の画像は生成できません。
もし、人間の画像を生成する場合は、有料のGeminアドバンスにアップグレードが必要です。
Geminの詳しい使い方は、以下の記事を参考にしてください。
参考:当記事のタイトルの画像は「Imagen 3」が作りました。
プロンプトは「自空間を超えた世界で猫が時計に上に座っている画像を作ってほしい。猫は黒い色で目はブルーで知的な感じがする。」です。
あなたが作ると、どのような画像になるのでしょうか?