ここ1、2年で突如現れた「ChatGPT」。今や聞いたことが無い人はいないのではありませんか?今回は、このChatGPTの機能の1つであるDALL.E 3について解説していきます!
「聞いたことはあるけど、イマイチよくわかってない!」という人のために、ChatGPTとDALL.E 3について簡単に説明します!
まず、「ChatGPT」とは、OpenAIが開発した最先端の会話型AIアシスタントです。このChatGPTは、自然言語(日常会話で使用するような人間が使用する言語のこと)を使った会話を通して、私たちの質問や要望、仕事のお手伝いなどを行ってくれます。
基本的なチャット機能は無料で使用することができるため、どんな人でも気軽に使用することできます。
さらに、有料プランに入ると...
・高速、高精度のチャット
・インターネット検索
・プラグイン(特定の機能を選択して追加することができるモジュール)の設定
・高性能なデータ解析
・ファイルの読み込み
・画像生成
・特定の分野に特化したチャットAIの利用
など非常に多くの機能が解放されます!
この圧倒的便利さと的確な返答によって、リリース5日間で100万人のユーザーを獲得しました!
これがどれくらいすごいのかを理解するために、いくつかの有名サービスと比較してみると、
Instagramはリリース約2.5ヶ月で100万ダウンロード達成
X(旧Twitter)は約2年で100万ユーザーを達成
Netflixは約3.5年で100万ユーザーを達成
となっており、いかにChatGPTの勢いが凄まじいかが伺えます。
現在(執筆時2023年11月13日)は、ユーザー数が1億人以上存在すると言われており、その勢いは止まることを知りません!
そして、今回この記事で取り上げているのは、先ほどチラッと話に出てきた「画像生成」の機能です。
このChatGPTの画像生成には、「DALL.E 3」というAIを使用しています。DALL.E 3は、テキストベースの情報を元に画像を生成するAIです。つまり、ChatGPTを介して行うチャットによって、ユーザーが求める画像を生成してくれます!
例えば、「可愛い子猫が噴水で水遊びをしている写真を作って!」とChatGPTにお願いすれば、下のような画像を作成してくれます。
「ChatGPTのDALL.E 3について大体理解したけど、他にもたくさん画像生成AIがあるけどどう違うの?」と思ったかもしれません。
確かに、MidjourneyやStable Diffusionなど他にもたくさんの画像生成AIがあることは事実です。(今回は他の画像生成AIについては深く掘り下げません。)しかしながら、ChatGPT DALL.E 3をわざわざ選んで使う理由は確かにあるのです!
それは...
反復学習による高精度な画像生成の実現
です。
ChatGPTの強みはなんといってもチャットで会話することで画像を生成できることです。ChatGPTはチャットを次々に行っていくうちに、そのユーザーと以前どのような会話を行ったか、その以前の会話から推測するに今回はどのような回答をユーザーが求めているかを考えながらチャットを行うようになります。すると...
私「水で遊んでる子猫の画像を作って!」
GPTくん「作ったよ!」
私「うーん、ちょっと思ってたのと違うなぁ。場所は噴水にして!」
GPTくん「作ったよ!」
私「いい感じ!でももうちょっとリアルな写真っぽくできる?」
GPTくん「(噴水が背景に映りながら、猫にピントが合っているようなイメージかな?)作ったよ!」
(ちなみに、こんな感じのやり取りで作った画像が上で紹介した猫の画像になります)
という風に過去のやり取りを踏まえた上で新しい画像を次々生成してくれます。
他の生成AIを使った場合、1回1回丁寧に長文を送る必要があり、2回目3回目と行ってもAI側は常に初めて扱う判定になってしまうため、自分の理想の画像に近づけることが難しいです。
その点、ChatGPT DALL.E 3を使えば、会話すればするほど自分の利用の画像に近づいていくため、「これだ!」という画像にたどり着ける可能性がグンと上がります!
さてついにChatGPT DALL.E 3の使い方について説明します。
と言っても、使い方を説明する必要もほとんどありません。なぜなら、有料プランで普通にチャットしているときに「画像を作って!」と伝えるだけでいいからです。
(無料プランでは画像生成機能はついていないので要注意!)
実は2023年11月6日に、「OpenAI DevDay」と呼ばれる開発者向けのカンファレンスが開催されました。このカンファレンス内でOpenAIは、新モデルやアップデート内容など多くの新情報を発表し、その中の1つであるChatGPTのUIのアップデートによって、より簡単にDALL.E 3を使用できるようになりました。この最新アップデートまでは、DALL.E 3用のチャット欄を選んで使用する必要がありました。しかし、最新アップデートによってわざわざ使いたい機能を選ぶ必要が無くなり、1つのチャット欄で複数のツールを利用できるようになりました。そのため、チャットで使いたい機能を伝えるだけで、自動的にその機能を呼び出してくれるようになり、利便性が格段に向上しました。
ですので、ChatGPTのDALL.E 3を使うためには...
1.有料プランに加入
2.ChatGPT4を選択
3.自由に会話
たったのこれだけです!
難しい設定や使用方法は何もありません。ただただ普通に会話を行って、画像が欲しい時にお願いするだけで生成できます!
ここまででChatGPT DALL.E 3についてと使い方を説明してきました。
「確かにすごい!でも、楽しいだけでどうやって活用するか想像つかないなぁ」と思っているかもしれません。ここまでの説明では確かにそう感じてしまいますよね。そこで、ここからは「生活やビジネスにどのように活用していくのか」を解説していきます!
ChatGPTのDALL.E 3は、チラシやSNS投稿用のキャンペーン画像作成にもってこいの性能です。ChatGPTとの会話を通して個人や企業の情報を理解してもらったうえで画像を生成してもらうことにより、個人や企業の内容を踏まえた画像を生成することが可能です。伝え忘れていた情報があれば後から追加で伝えればアップデートされた画像を生成させることも可能です。
しかしながら、画像内に文字を入れるような画像を求めている場合はあまりお勧めできません。残念ながら現状のDALL.E 3では、特定の文字を画像内に正しく表示する精度はあまり高くありません。特に日本語を表示して欲しいとなると、その制度は更に落ちてしまいます。英単語や英語の短い文章なら、何回か生成してもらうことで、正しい文字を表示できる可能性はあります。しかし、例えば「10月13日~キャンペーン開始!」のような文章を表示させることは不可能に近いです。(もしあるなら是非教えてください!)
ですので、イラストや写真風などの文字を入れない部分の画像用として活用する形が理想です。英単語や短い英文なら生成できる可能性が高いので、何度かトライして理想の画像を生成できます。
文字を入れたい場合は、
typography “〇〇”
と記載して、〇〇の部分に表示したい文字を入力すると上手くいきやすいです!
(短い英単語くらいであれば特に工夫して伝えなくても汲み取ってくれます!)
クリエイターの活用ももちろん可能です。画像や写真、構造物などのクリエイティビティが求められている領域において、デザインコンセプトとしてDALL.E 3を活用できます。新しいアイデアが思いつかない、思いついてはいるけれど具体的なイメージが湧かないというような際に、DALL.E 3を使用してコンセプトやイメージの確認を行うことができます。生成された画像を元に、アイデアの実現可能性、コンセプトにズレがないか、オリジナリティなどの要素を確認する材料として活用し、そこで得た知見を元に本格的な制作工程に向かうことができます。
他にも、新規企画のプロトタイプイメージやコンセプトアートの作成にも使用できます。新規企画としてプレゼンする際の挿絵が欲しい、言葉だけで伝わるか不安だから簡単なイメージが伝わる画像が欲しいという際にはもってこいです!
試しに新しいチョコの企画を発表する際に利用できそうな画像を作ってもらいました!
今や誰もが持っているSNSに使用するアカウントのアイコンやロゴなどを作成することができます。ChatGPTのDALL.E 3は、画像の比率を指定しない場合は正方形の画像を生成します。そのため、SNSでよく見る円形のアイコンを設定する際に、画像のどこを使うかを考えなくても良いためスムーズに設定できます。
DALL.E 3と会話する際に、ドット、リアル、抽象的等のスタイルを指定することで多種多様な回答を得ることができます。また、参考にしたいアイコンやロゴがあれば、ファイルやリンクをChatGPTに教えることで参考にしてもらったり、自分のイメージを伝えてからいくつかのプロンプトを作成してもらった後に、気に入ったプロンプトで画像を生成してもらうなど、多くの活用方法があります!
試しに企業ロゴとSNS用のアイコンを作ってもらいました!
画像生成とファッションは非常に相性が良いです!
後で活用事例として詳しい説明を行いますが、モデルが服を実際に着用しているイメージ画像を生成するサービスが生まれたりしているくらい、画像生成AIとファッションは相性が良いです。といっても、さすがにDALL.E 3では自分が服を試着しているイメージを再現することは難しいです。では、どこが相性が良いのかというと、「新しいファッションの開拓」ができます。ある特定の人に服を着させることは難しいですが、人自体に服を着させることは可能です。ですので、自分に合う服を探すために使うのではなく、新しい服や帽子、靴などのファッションアイテムを創り出すために使います。各企業のオリジナリティを取り入れるために、一般的なファッションアイテムに少しアクセントを入れたイメージ画像や、ファッションショーなどの特別な場で使用するための独創的なデザインのイメージ画像などを生成することで、デザインの方向性を確認する、あるいは新しいデザイン自体を共に考えてもらうことができます。
また、ファッションアイテムの組み合わせのイメージにも使用できます。自分が持っている色や服の種類を指定し、そのコーデに合わせたいズボンや帽子、靴の情報を追加して生成することで、コーディネートの確認として使用することもできます。
画像生成AI×ファッションにはまだ活用方法があります。それは、デジタル空間上のファッションアイテムのイメージ用資料としての活用です。何もファッションはフィジカル空間だけの話ではありません。今やゲームやメタバース空間内の衣装やアイテムとしてのデジタルファッションも存在します。このデジタル空間ではまさに自由自在のファッション表現が可能です。誰でもスパイダーマンになれ、ガラスの靴だって履けます。そんななんでもありの空間だからこそ、AIが生成した画像が良い資料になります。
生成した画像を元にゲームやメタバース空間上のファッションアイテムのアイデア出しや参考資料として画像生成AIが大活躍します。DALL.E 3を使って新しいファッションアイテムのイメージを作り、自分で製品化を目指したり、ゲーム開発の資料として活用しましょう!
ブログやWebサイトの背景画像や、雑誌や本の背景画像、ゲームやアプリ開発用の画像など、メインの画像ではなく、あくまで一つのパーツとして利用することもできます。上記のような制作を行っている場合、無料で使える素材を使ってるといまいちパッとしなかったり、どこか見たことがあるようなデザインになったりしてしまう。そのような経験がある人もいるのではないかと思います。そこで、DALL.E 3を使用してオリジナルの素材を作り、オリジナリティを出します!
DALL.E 3で画像を生成する際に、1点だけ注意すべき点があります。それは、生成した画像の使い方を事前に決めておくことです。
先ほども触れましたが、DALL.E 3は特に指定が無い場合は正方形の画像を生成します。ですので、自分でサイズの指定を行う必要があります。現在のDALL.E 3では...
・正方形(1024×1024)
・ワイド(1792×1024)
・トール(1024×1792)
の3種類のサイズの画像を生成できます。逆に言えば、この3種類以外のサイズは生成できません。ですので、自分が欲しい画像の比率と描いてもらった画像のどの部分を使うつもりかを逆算して生成する必要があります。ですので生成する前に、「どのサイズが欲しいのか」、「生成された画像のどこを使うのか」を決め、生成された画像を外部ツールを使用して細かいサイズや明るさなどを少し編集する必要があります。
少し手間がかかりますが、オリジナリティを出すためのひと工夫だと思って頑張りましょう!
ここまで画像生成AIの活用方法についてお話してきましたが、
「活用方法は分かったけど、実際に活用している事例はあるの?」
と思ったかもしれません。そこで、最後に画像生成AIを活用している事例をいくつか紹介します!
英King’s College London、米National Institute of Mental Health、英Birkbeck College、英University College Londonによる研究チームが発表した論文「Brain Imaging Generation with Latent Diffusion Models」で、脳のMRI画像を10万枚生成し、医療用の大規模なデータセットを作成したという研究です。この研究の背景として、プライバシー保護の観点から、公開されている医療用データセットが極端に少なく、研究用の大規模なデータセットが不足しているという問題がありました。
そこで、約32,000枚のトレーニング画像を元に脳の合成画像を生成したところ、非常に現実的で高品質な合成画像が生成できることが確認されました。年齢や性別、頭の大きさなどの条件を設定すれば、条件通りの画像を生成することも確認され、十分にデータセットとして活用可能な画像を生成することに成功しています。
この事例のように、画像生成AIを活用して事例の少ない症状や病気の画像データを大量に生成し、生成した画像を元に研究を行うという活用方法が医療業界で非常に注目されています。今後の医療とAIの関係にも要注目です!
先ほどの活用方法でも少し触れた、画像生成AIを活用することでファッションを試着しているイメージ画像を生成するサービスが流行しています。2023年11月時点でも既に何十件も確認できました!
Vivid AIやMyEdit、TIPSNAP、PhotoDirector、Vmake、StyleAI、Vue.AI、Vmodel.AIなど国内外問わず非常に多くのサービスが見つかります!
また、皆さん大変お世話になっているあのGoogleも「Virtual Try On(VTO)」というAIバーチャル試着機能をアメリカで既に展開しています!
既にAIファッションサービスは圧倒的な盛り上がりを見せており、手を伸ばせばサービスを利用できる状態にあります。本記事では各サービスについて詳しい説明を行いませんが、是非とも興味がある人はご自身で調べて利用してみて下さい!
さて、ここまでDALL.E 3及び画像生成AIについて説明してきましたが、画像生成はあくまでAIの極一部に過ぎません。極一部の画像生成AIだけでも、圧倒的なインパクトがあることが本記事からも伝わってきたと思います。AIの可能性は無限大であり、今後から目が離せません!
そんなAIの可能性について徹底的に議論を行い、未来を創るリーダーたちが集結するカンファレンスが2024年4月13日(土)から14日(日)にかけて開催されます!
その名も...
AI専門家や業界のビジネスリーダーが世界中から集まり、未来のAIとWeb3の可能性について議論を行います!
「AIの専門家やビジネスリーダーの知見を知りたい!」という人から、「これからAIについて詳しく知っていきたい!」という人まで、AIについて理解を深めたい方ならどんな人でも楽しめること間違いなしのイベントです!
イベントの詳しい詳細やチケットの購入はこちら!
TEAMZ WEB3 / AI SUMMIT 2024 公式ホームページ
TEAMZ WEB3 / AI SUMMIT 2024 公式チケットページ
最後まで読んでくださり、本当にありがとうございます!
意見や質問等ございましたら気軽にご連絡ください!
メールアドレス:info@teamz.co.jp
それでは、またどこかでお会いできることを祈っております!さようなら!