近年、さまざまなメディアで「生成AI(ジェネレーティブAI)」が取り上げられるようになり、ビジネスにおいても日に日に活用の幅が広がっています。しかし、DXが進んでいない企業、ITやデジタルに関する知見を有していない企業にとっては、「生成AIって何?」「自社の業務にどう活かせるのか分からない」という状況かもしれません。
本記事では、生成AIの仕組みやどういったことができるのか(できないのか)、そして実際に企業で取り入れられている活用事例などについてご紹介します。
はじめに、近年注目されている生成AIの概念や定義を解説します。生成AIの仕組みや誕生から現在に至るまでの歴史も合わせて確認しておきましょう。
生成AIは、独自のコンテンツを生成することを目的としたAIを指します。「Generative AI(ジェネレーティブAI/生成力のあるAI)」とも呼ばれており、決められた行為を自動化するために作られた従来のAIとは目的が異なります。
明確な定義はありませんが、米・OpenAI社が開発した「ChatGPT」のように、簡単な指示や命令(プロンプト)を出すことで要求されたコンテンツを自動的に生成するシステムを指すケースが一般的です。また、プログラミングに関する高度な知識やスキルがなくても、手軽に利用できるのが生成AIの特徴と言えます。
生成AIがオリジナルのコンテンツを作成できるのは、テキストや画像といった膨大な学習データを取り込んでいるためです。
たとえば私たちが犬のイラストを描く場合には、頭の中に記憶されている犬の姿を思い出し、それを描き起こします。生成AIもこの人間のプロセスと同様に、膨大な犬の画像データから共通する特徴を抽出し、それをもとにオリジナルのコンテンツとして表現(出力)しています。
そのため、学習データの量が多いほど生成AIはさまざまなパターンを学習でき、生成できるコンテンツの精度も高まっていきます。
「ChatGPT」の存在が近年の生成AIブームに火をつけたと言っても過言ではありませんが、AI開発自体の歴史は古く、1950年代や1960年代に遡ります。しかし、60年代頃に研究されていたのはルールベースのシステムや論理推論で、その時代のAIは「簡単な質問に答える」という、今でいうチャットボットの原型のようなモデルでした。
その後、2010年代に入ると、ディープラーニング(深層学習)の一種である「生成敵対ネットワーク(GAN)」という技術が進化。これにより高度な内容のテキストや画像の生成ができるようになり、生成AIの可能性は一気に拡大します。そして、2020年代に入ってからGPT(Generative Pre-trained Transformer)と呼ばれる大規模言語モデルが登場したことで、人間が作成したような自然な文章を機械的に生成できるようになりました。
現在ではテキストや画像はもちろんのこと、音楽(音声)や動画などのコンテンツを瞬時に自動で作成できるようになり、一般の個人ユーザーからビジネスに利用したい企業まで生成AIのニーズが急速に拡大しています。
ビジネスにおいて生成AIが注目されている背景には、DXの推進や深刻化する人手不足などが要因として挙げられます。
たとえば、人手不足の中でも企業が従来と同等以上の生産性を確保するには、業務プロセスを見直してムリ・ムダ・ムラを徹底的に削減することが欠かせません。しかし、そのために高度なITシステムを整備するとなると、多額の導入コストや維持費がかかるほか、システムの運用管理にも専門的なスキルを持った人材が必要になります。
そうした観点から、「コストパフォーマンスに優れた業務プロセス改善の選択肢」として生成AIへの関心が高まっているのです。
「AI」と聞いて「人間の作業を短時間で終わらせてくれる万能なツール」というイメージを持っている方も少なくありませんが、生成AIには得意・不得意があり、実際には対応できないことも多くあります。生成AIのビジネス活用を検討する前に、できること・できないことを正しく理解しておきましょう。
生成AIには種類があり、1種類の生成AIですべてに対応できるわけではありません。生成AIは、生成するコンテンツの種類によって異なる特徴を持ちます。共通しているのは、大規模なデータセットを用いた深層学習が基盤となっている点です。
なお、それぞれ異なるタイプのデータ(テキスト、画像、音声など)を生成するために、異なるモデルや技術が用いられています。得意分野や対応できる作業の一例は以下の通りです。下に行くほど高度なモデルや技術が必要とされます。
オリジナルの文章を一から作成すること、適切な文体や表現への変換、誤字脱字の指摘・修正などが可能です。ビジネスでは報告書の作成や取引先へのメールなど文章を作成する機会が多くありますが、生成AIを活用すれば文章作成における大幅な業務効率化が期待できます。
また、生成AIなら専門的な知識がなくても容易にプログラムのコード生成が可能。コーディング時のバグを検出したり、修正したりすることもできます。
対象:テキスト、文章、プログラム(ソースコード)の作成
テキストを使って簡単な指示を出すだけで、画像やイラストなどのオリジナルコンテンツを作成できます。プロのデザイナーやイラストレーターに制作を依頼すると高額な費用や制作時間がかかりますが、生成AIを活用すればすぐにコンテンツが手に入ります。
対象:イラスト、写真、デザイン
人間の声を再現できる生成AIです。音声のサンプルがあれば、その話者と似た音声で場内アナウンスやガイドをしたり、オーディオブックを読み上げたりすることができます。また、病気などで声を失ってしまった人の会話をサポートするような活用法も考えられます。
対象:音声データ (話し声、歌声など)
多様な音楽的理論や譜面のパターンを学習し、歌や楽曲を自動生成できます。専門的な機器や作曲に関する知識がなくても、オリジナルの音楽を作れるのが特徴。テレビやラジオ、舞台の幕間などに使うジングルや、広告映像などに載せるBGMなどを作るのに利用するケースが考えられます。
対象:楽曲、メロディー、伴奏
文章や画像といった入力データから自動的に動画を作成する生成AIです。動画制作には完成までに多くの工程がありますが、動画生成AIを使えば編集などの作業を大幅に効率化し、高品質なコンテンツを短時間で作成できます。字幕の作成や翻訳も可能です。
対象:動画、アニメーション
2次元のイラストや画像だけでなく、3次元のモデルデータを作成できる生成AIもあります。テキストプロンプトからでも、2D画像からでも3Dモデルの生成は可能。ゲーム内キャラクターや工業・建築デザインの制作、建築物の外観シミュレーションなどに活用できます。
対象: 3Dオブジェクト、3Dキャラクター
上記とは反対に、現時点で「生成AIでの対応が難しい」とされる作業は以下の通りです。
生成AIに該当する学習データがない場合、指示を出してもコンテンツを生成することができません。たとえば、「ChatGPT」には無料版(GPT-3.5)と有料版(GPT-4)がありますが、無料版は2022年1月までの情報、有料版は2023年4月までの情報を学習しています。そのため、GPT-3.5に2023年4月時点の情報を求めてもアウトプットに反映されない点は注意が必要です。なお、企業の社内情報はそれ自体を読み込ませないと生成AIが回答できないため、最近では生成AIと社内情報をつなぐ技術が開発されています。
また、学習データに誤りがあった場合に、「複数のソースから情報を収集し、正しい情報に訂正する」といったこともできません。
作業の一例:今日の新聞に掲載されていたニュース記事の要約 など
生成AIはオリジナルのコンテンツを一から作成できるものの、人間の感情を理解したり、感情を表現したりすることは難しいケースが多いと言えます。人間であればメールの文面や話し方、声のトーン、仕草などで相手が喜んでいるのか、怒っているのかを察することもできますが、生成AIではそのような推察が困難です。
作業の一例:相手の感情を汲み取った臨機応変なメール対応・電話対応 など
生成AIは人間のように常識的・倫理的な判断を下すことができません。時代とともに人々の価値観や考え方は変化していくため、たとえば5年前、10年前の「当たり前」が現在では「不適切」と捉えられることもあるでしょう。コンプライアンス上不適切なコンテンツや表現が生成AIによって作られる危険もあり得ます。
作業の一例:SNSにおける不適切投稿のチェック など
生成AIには得意な作業もあれば苦手な作業もありますが、メリットを最大化するためにはどういった活用方法が考えられるのでしょうか。
ある大手金融機関Aでは、稟議書やプレゼン資料といった社内文書の作成に膨大な時間と手間を要していました。そこであらためて社内業務を洗い出し、「ChatGPT」の業務活用を前提に検討したところ、ひと月あたり約22万時間もの労働時間を削減できるという試算結果が導き出されることに。情報セキュリティの観点から全業務に生成AIを活用することは難しいものの、すでに200以上のユースケースにおいて活用されているそうです。
社内情報を取り込んで自社用にアレンジする必要はあるものの、生成AIのビジネス活用により、営業活動や既存顧客への対応などよりコアな業務に時間を割くことが可能になりました。今後大きな変化が予想される金融業界において、新たなビジネスチャンスの創出にもつながると期待されています。
全国にスーパーやコンビニを展開する大手小売事業者Bでは、自社ブランド商品の開発に生成AIを活用しています。
食品や飲料といった製品は季節ごとに売れ筋商品が変化し、トレンドも短期間で入れ替わっていく特性があります。それだけに、今後どのような製品のニーズが高まっていくのかを予測するのは簡単なことではありません。そこで、過去の売上や市場全体のデータを生成AIによって解析し、新製品の開発に役立てるというデータドリブンな意思決定を取り入れています。
ある化粧品メーカーCでは、生成AIを使って肌の悩みを解決するためのチャットアプリを開発し、各ユーザーにとって最適なスキンケア方法や関連商品を提案しています。
美容や健康に関してはコンプレックスを抱えているケースも多く、「第三者に相談しにくい」と感じている人も少なくありません。生成AIの活用によって対面では相談しにくいことも質問できるようになり、関連商品の売上アップはもちろん、顧客エンゲージメントの向上にも貢献しています。
生成AI(ジェネレーティブAI)は、学習したデータから独自コンテンツを自動生成できるAIです。日々の業務の効率化や部署・組織の生産性向上に貢献してくれる便利なツールであり、できること・できないこと(難しいこと)を理解し、適切に活用すれば、人手不足の解消やイノベーションの創出につながる可能性があります。
リコーでは、業種や業務に合わせて利用できるAIサービスの提供により、お客様のDXを支援しています。そのひとつが、RICOH kintone plusの新機能「アプリ作成アシスタント」です。「アプリ作成アシスタント」では、チャット形式で指示を出すことでAIがアシスタントとしてアプリを自動で作成します。
以下の記事では、RICOH kintone plusの「アプリ作成アシスタント」の詳細や現場からの声を詳しく解説しています。ぜひこちらもご覧ください。
東京大学 博士(工学)。現在は埼玉学園大学経済経営学部で教授を務めるかたわら、企業の業務効率化に対する支援を行っている。約10年間にわたってAI活用による業務効率化を研究しており、2023年にはこれまでの研究から『「生成AIによる活用による業務改革」-ChatGPTやBardを活用した業務効率化-』を上梓。