昨今、巷では生成AIを利用した製品やサービスが多く見られるようになりました。AIを業務に利用するケースもありますが、自分が利用している生成AIがどんなものなのかよくわからない、という方もいらっしゃるのではないでしょうか。
そこで本コラムでは、一般的によく利用される生成AIの種類についてご紹介します。
生成AIの種類
生成AIの種類は、生成できるものの種類によって「テキスト生成型」「画像生成型」「動画生成型」「音声生成型」の大きく4つに分けることができます。下記に、それぞれの特長を解説します。
1. テキスト生成型
チャット画面で会話をするような流れで文章を生成することができます。主な用途は記事作成や文書作成、メール作成等です。代表的なサービスとしてOpenAI社のChatGPTがあります。
文章そのものの作成や、入力した文章の構成、入力内容をもとにした案出しなどにも利用できるため、日常的なビジネス業務においても活躍します。
【参考】ChatGPT|OpenAI
2. 画像生成型
キーワードや文章で指示を出すことで、イラストや写真のような画像を生成できるAIです。代表的なサービスとしてMidjourneyや、Adobe社のFireFlyがあります。指定した内容の画像を生成することをはじめとして、指定した写真のフレームアウトした部分を生成する、必要なオブジェクト/不要なオブジェクトを追加/削除する等の編集作業も行えます。
デザインに利用される画像素材の作成や、広告ビジュアル等にも利用されています。
【参考】Midjourney
【参考】Adobe Firefly - クリエイティブのための生成AI
3. 動画生成型
動画を生成できるAIです。素材となる画像や音楽をアップロードすることで動画を生成するものから、テキストでイメージを指示するだけで動画を作成するものまで多岐にわたる種類があります。OpenAI社のSoraなどは、テキストから動画を生成できるタイプの動画生成AIです。
Web上に掲載する動画の生成はもちろん、SNS上の広告素材等に生成された動画を利用するケースもあります。
【参考】Sora|OpenAI
4. 音声生成型
学習元となる音声データをアップロードすることによって、音声の特徴を学習、再現することができるAIです。一度学習させることで、同じ声を利用したテキスト読み上げを容易に行うことができるようになります。
Microsoft社のVALL-Eなどは、3秒程度の音声データから学習を行うことができます。アナウンス音声への利用などが期待されています。
【参考】VALL-E
以上のように、生成AIと一口に言ってもサービスの種類によってできることは変わります。自社の業務の中で生成AIを利用したいと考える場合は、どんな業務に生成AIを利用したいのか、何を生成したいのかということをあらかじめ考えておくことが必要です。
また、生成AIの利用に関しては情報漏洩や権利面のリスクが散見されており、入力/出力していい情報/悪い情報の見極めも大切です。本コラムでは海外のサービスも多く紹介していますが、自社業務での活用の際には困った時に問い合わせや相談ができる国産のサービスを利用することがおすすめです。
ぜひ、リスクやデータの利用条件には留意した上で、自社の業務のどんな部分にAIを活用できるか、どんな課題を解決できるか考えてみてください。
関連ページ