現在、生成AIの技術が世界中で大きく注目されています。例えばChatGPTのようなテキスト生成AIは、その豊富な情報量によってさまざまな領域のアナリストの役割をこなすだけでなく、これまで行われていたコンピュータによる自然言語処理のタスクの大部分をかなりのスピードで置き換えています。また、Stable Diffusionをはじめとする画像生成AIは、ほとんどプロ並みのクオリティのイラスト画像を数行のテキスト指示で生成できるようになっています。しかし生成AIが与えるインパクトは単なる技術的な側面だけでなく、経済や社会課題へ与える影響も無視できません。さまざまな生成AIのビジネス活用を紹介しつつ、その技術が世界をどう変えていくかを考察してみたいと思います。
INDEX
生成AIとは
生成AIとは、文章による指示をインプットすることで、その指示に従った新たな文章や画像などのコンテンツを生成することができるAIのことです。すでに多くのメディアでも紹介されている通り、生成AIの進化が実用的なレベルに達していることが大きな注目を集めています。この結果、生成AIをビジネスで活用するさまざまなアイデアが生まれ、多くの企業が注目しています。
従来のAIができることは、判断・予測・分類・検出などでした。つまり、「売上予想」だったり、「ニュースカテゴリの分類」だったり、「製品の傷の検出」という特定の情報の出力が主なタスクです。しかし、生成AIの出力はテキストや画像といった、非常に自由度の高いコンテンツです。この自由度の高いコンテンツを意のままに生成できるようになったことが、AIの一つの転換期となっています。なぜなら、これまでAIでは困難とされてきた「新たなコンテンツの創造」や「新たなアイデアの考案」が実現できているように見えるからです(例えそれが蓄積された膨大な情報からブレンドされて生み出されたものであったとしても)。
主な生成AIには、大規模言語モデル(LLM)を活用したテキスト生成AIと、画像生成AIがあります。
テキスト生成AIは、文章による指示をインプットすると、その指示に基づいた回答をテキストで出力します。テキスト生成AIの1つであるChatGPTは、その回答精度の高さが全世界で大きな注文を集め、多くのメディアでも紹介されるようになりました。多くの自然言語処理の案件や、チャットボットの開発に携わってきた筆者も、当初その精度の高さに衝撃を受けました。テキスト生成AIのテキスト指示のインプットからテキストを生成する、という特性を利用し、多種多様なタスクを実行することができます。さまざまな質問に答えたり、文書を要約したり、翻訳したり、プログラムを作成したりできることは、多くのメディアで紹介されている通りです。
タスク | 概要 |
文書要約 | 長い文書のテキストから、観点や長さを指定して文書の要約を生成 |
記事作成 | テーマ、観点、スタイルなどを指定して、その内容に沿った文書の生成 |
調査業務 | 世の中一般の知識範囲について調査を実施したうえで、その要約の文書を生成 |
翻訳 | 複数の言語に対応した翻訳文を生成 |
プログラミング支援 | 文書の意図に沿ったサンプルプログラムの生成やコードレビュー文書、不具合の検出、エラーの解析などが可能 |
これを端的に表現すると、テキスト生成AIはテキストで質問してテキストで回答できることであれば大抵のことはできてしまう、ということです。ただし、回答が可能なベースの情報源は世の中一般の公開情報に限られます。自社の業務マニュアルや最新の世界統計情報を答えさせることは、通常のやり方では困難となります。
画像生成AIは、文章によって生成したい画像の内容をインプットすると、その内容通りの画像が生成できます。ひと昔前までは、画像生成のAIが出力する画像は不自然な構図だったり、不十分なデザインになることが多かったのですが、最近の画像生成AIが生成する画像は、デザイン的にも優れていたり、本物の写真と見分けがつかなかったりするレベルに達しています。つまり、ビジネス上のクリエイティブ素材として十分に利用できる状態になっています。 生成できる画像の種類は多岐にわたります。対象、テーマ、アーティスト、スタイル、時間帯、天候など、ありとあらゆる描画イメージを指定して画像を出力することが可能です。画像生成AIが出力する画像を以下のようにビジネス活用するアイデアが生まれています。
タスク | 概要 |
Webサイト制作 | Webサイト制作におけるクリエイティブ素材の生成 |
広告・CM作成 | 広告・CMにおけるクリエイティブ素材の作成 |
ゲーム開発 | ゲーム開発におけるキャラクターの生成 |
商品デザイン | 新商品のパッケージデザインの生成 |
ファッションデザイン | バッグ等のファッションアイテムの新商品デザイン案の生成 |
インテリアデザイン | オフィスインテリアの提案イメージの生成 |
生成AIの能力
〇テキスト生成AIの能力
キスト生成AIはあらゆる情報を持っているため、ときに万能に見えてしまうこともありますが、実際のところは「知識の量はすごいが、ちょっと融通が利かない秘書」といったイメージです。例えば
生成AIを利用した新規ビジネスを企画しようと思います。外部環境分析をしてください。 |
のような質問をテキスト生成AIにすると、以下のように一般的なPEST分析の手法を答えてくれるだけです。
① 政治・法律環境:政府の規制や税制改革などがビジネスに影響を与える可能性があります。また、知的財産権の保護なども重要な問題です。 <以下同様> |
本当に欲しい中身のある外部環境分析を得るには、もっと具体的にテキスト生成AIに指示をする必要があります。
1. 生成AIを利用した新規ビジネスを企画しようと思います。 2. 1.外部環境要因をPEST分析の手法で上げたうえで、以下の分析をしてください。 3. 1-1.それぞれの外部環境要因において生成AIがどのように影響をうけるのか説明してください。 4. 1-2.それぞれの外部環境要因において生成AIの未来予測を追加してください。 |
そうすると、テキスト生成AIは以下の回答を生成してくれます。
① 政治(Political) 政策:政府や法規制当局による法的な制限や動向。 影響:生成AIによって、政治的な監視や規制上の制限を受ける可能性があります。また、国家安全上の観点からも、AIの活用に対する制限が課せられる可能性があります。 未来予測:政府や法律制定団体には、AIに対する対応策が必要になるでしょう。一方、生成AIの進化により、政治的な意思決定や法制度の作成において、AIがより大きな役割を果たすことが予測されます。 <以下同様> |
このように的確な回答を得るためのテキスト生成AIへの指示文の書き方は「プロンプトエンジニアリング」と呼ばれ、各方面で研究が行われています。上記の例はその1例で「思考の連鎖」(Chain-of-Thought)と呼ばれ、テキスト生成AIに考え方の流れを含めて指示することで、より的確な回答を引き出すためのテクニックになります。このようなプロンプトエンジニアリングは、すでに多くの研究がなされ、その内容が公開されています。逆に言えば、このような的確な指示・ドキュメンテーションができる人が、生成AIによってより効果的な情報を得て生産性を上げることができる、ということになります。
〇画像生成AIの能力
前述のプロンプトエンジニアリングが重要なことは、画像生成AIについても同様です。生成したい画像の情報を、できるだけ詳しく文書で指示することで、その通りの画像を生成することが可能です。以下に指定できるプロンプトの種類を上げてみます。
- 描画対象:物、動物、風景、等
- スタイル:写真、水彩画、油絵、アニメ、等
- アーティスト:ピカソのような、レオナルド・ダ・ヴィンチのような、等
- 調整:繊細な、ナチュラルな、シャープな、壮大な、ドラマチックな、等
- 時間帯:早朝の、夜の、等
- 天候:晴天下の、雨が降っている、等
- 照明:右から照明があたった状態、等
- ネガティブプロンプト:画像から取り除きたい対象を指定
思い通りの画像を生成するにはそれなりの経験の蓄積が必要ですが、いずれにしても、画像のイメージを詳細に言語化できる能力が求められるということです。
以上のことから、生成AIを最大限に活用するには利用する人のドキュメンテーション能力が重要になります。逆に言えば、ドキュメンテーション能力が高い人ほど、生成AIからより高い価値を引き出すことが可能になります
生成AIの課題
生成AIについての課題についても、さまざまな議論があることは、すでにご存じの方も多いと思います。回答に嘘が含まれる(ハルシネーション)、情報漏洩のリスク、政策的なリスクなどがありますが、ここでは「著作権に関するリスク」、「エネルギーに関する課題」について取り上げてみたいと思います。
「著作権」の問題は、今後生成AIが健全な成長を続けることができるかについて、非常に重要なポイントになってきます。生成AIがの学習に利用しているテキストや画像の学習データセットは、主にインターネットの公開情報から収集されたオープンデータです。そして、生成AIベンダーがそれらのデータを著作権者に無断で利用し、その著作権を侵害した形で莫大な利益を得ているとして、著作権者からの集団訴訟が始まっています。多くの国では、公開されている著作物について公共や教育の目的だったり、オリジナリティを追加した上での流用といった特定の条件下で著作権者から許可を得ずに利用しても、著作権の侵害にはならない法概念が存在します(アメリカでは「フェアユース」と呼ばれる)。そして、生成AIのオープンデータの利用がこのフェアユースにあたるかどうかについて、慎重な議論が始まっています。学習データセットを参考にしながらもオリジナルのコンテンツを生成する生成AIは、最終的にはフェアユースと判断されるのではという観測もありますが、集団訴訟の行方がどうなるかは誰にも分かりません。
もう一つの問題として、生成AIによって生成されたコンテンツそのものが著作権侵害に当たるとして訴訟を受けるリスクがあります。さらにややこしいことに、その責任の所在が生成AIの利用者にあるか、生成AIのベンダーにあるか、まだあいまいなままであるという点です。このため、生成された画像をそのままクリエイティブ素材として公開利用してしまうと著作権侵害のリスクを抱えてしまうことになります。現時点では、生成された画像は内部での利用に留める、あるいは十分にオリジナリティを加えた上で公開利用する、といった対策が必要です。 ここからは著者の想像になりますが、この問題は最終的には落ち着くべきところに落ち着くのではないかと思われます。つまり、著作権者への補償は行われる(ただしかなり少額になるのでは)、それによって生成AIは健全な状態で成長ができるようなスキーム、法規制ができあがる。今後人間によって生成されるコンテンツは、より良質なものについては生成AIへの学習用としても価値があるものとしてより高い評価がされる、そのような時代になるのではないかと想像しています。
次にエネルギーの問題について考えてみます。例えばテキスト生成AIで利用されるLLMを開発するには、膨大な学習データを長時間にわたって学習させるための大規模な計算資源が必要で、普通に学習させるだけでも数億円かかると言われています。さらにグローバルで競争力のあるLLMを開発するには、数百億円以上の資金が必要と言われています。生成AIの独自開発は一般的な企業が手をだせる領域ではなくなっているため、通常はサービス提供されているAPIを活用したり、より低コストで追加学習を行うファインチューニングに頼ることが一般的になっています。
生成AIはその開発だけでも莫大なコストがかかりますが、そのサービス利用に関しても相当のコストがかかっています。例えばChatGPT(GPT-3.5)はパラメータ数が推定3,550億個と言われていますが、これは1回の利用で3,550億回以上の演算をしていることになり、これだけでもかなりの計算資源とエネルギーを消費していることが分かると思います。より最新のモデルであるGPT-4のパラメータ数は推定で1兆とも言われています。実際にOpenAIはその稼働コストに1日70万ドル(1億円弱)かかっているという推定もあり、経済的なリスクを抱えているとも言われています。このため、生成AIがエネルギー消費・環境資源に与える影響も、だんだんと無視できなくなっています。この問題は「著作権」と同様に、早急に解説すべき課題であると筆者は感じています。どんな素晴らしい技術であっても、経済的なメリットがなければその技術は発展することができなくなるからです。
ただ、消費電力を削減するための取組はさまざまなところで始まっており、それほど悲観的ではないかもしれません。Google やMicrosoft等のAIベンダーは、自社のデータセンターで利用する、より消費電力の少ないAI専用チップの開発を進めています。またMeta(旧Facebook)はパラメータ数を大きく削減しながら、既存のLLMと同等の精度を実現したモデルLlama 2 を発表したり、Googleはパラメータ数を拡大しながらも計算コストを大幅に抑えるモデルSwitch Transformerを発表したりしています。こうした技術の進歩が、生成AIの発展・普及には欠かせないと感じています。
(後編に続く)
AI・データ分析サービス
https://www.tis.jp/service_solution/data-analytics/
データ分析・AI人材育成支援サービス
https://www.tis.jp/service_solution/ai-education/