生成AIの仕組み解体新書

先日、小学生の甥っ子から「AIってどうやって文章や絵を作るの?」と質問されました。「スゴイ計算をしているんだよ」と答えたものの、これでは何も説明したことになっていませんよね。。。

みなさんも、ChatGPTや画像生成AIを使っていて、「どうしてこんなことができるんだろう?」と不思議に思ったことはありませんか?

AIが身近になった今だからこそ、その仕組みを知ることで、より便利に、そして適切に活用できるようになります。魔法のように見えるAIの裏側を、今日は小学生でもわかるように解説していきます。。。

目次

AIは「パターン」を学ぶお絵かきマシン

生成AIの基本的な仕組みは、実は子どものお絵かきに似ています。

例えば、たくさんの犬の写真を見た子どもは、「犬はこんな形をしている」というパターンを頭に覚えます。そして自分で犬の絵を描くとき、そのパターンを思い出して描きますよね。

AIも同じことをしています。ただし、AIの場合は…

  • 何億、何兆もの例(文章や画像)を見る(GPT-4は主にインターネットの記事60%、書籍15%、学術論文5%などから学習)
  • それらの中にあるパターンを「Transformer」という仕組みを使って数学的に記憶する
  • 新しく何かを作るとき、覚えたパターンを使って「次に来そうなもの」を予測する

つまりAIは「超大量の例から学んで、パターンを真似るマシン」なのです。

AIの頭の中は「確率」でできている

「AIの頭の中はどうなってるの?」と聞かれたら、「複雑な確率計算の仕組み」と答えるのがぴったりです。

例えば、「今日の天気は」という言葉の後に来る可能性が高い言葉は何でしょう?「晴れ」「雨」「曇り」などが考えられますよね。AIはこれを正確な確率で計算します。

実際のAIでは、こんな感じの計算をしています:

  • 「今日の天気は」の後に「晴れ」が来る確率:38.2%
  • 「今日の天気は」の後に「雨」が来る確率:29.5%
  • 「今日の天気は」の後に「曇り」が来る確率:25.1%
  • その他の言葉が来る確率:7.2%

AIは膨大な文章を読んで、「この言葉の後にはこの言葉が来ることが多い」という確率パターンを学習しています。これを数万もの言葉の組み合わせで覚えているのです。

2024年の最新AIは、単なる「次の言葉」だけでなく、文脈や意味も考慮できるようになっています。例えば「彼は熱があるので学校を休んだ」という文章を理解し、関連する情報(熱→病気→休む必要がある)も確率的に関連付けられるようになっているのです。AIはこれを「自己注意機構」(難しい言葉ですね!)という仕組みで実現しています。

AIはどうやって学習する?

AIの学習方法は、私たちが言語を覚える方法とちょっと似ています。

1. たくさん見て覚える(事前学習)

小さい子どもが言葉を覚えるとき、最初はたくさんの会話を聞いて、パターンを少しずつ理解していきます。AIも同じように、インターネット上の大量の文章や画像を見て学習します。

OpenAIの情報によると、GPT-4はインターネットの記事(60%)、書籍(15%)、学術論文(5%)など様々な情報源から学習しています。この学習には、とてつもない計算量(数字で書くと2.15×10^25回!)が必要でした。この段階では、AIは言葉と言葉の関係性を広く浅く学びます。

2. 特定の目的に合わせて調整する(ファインチューニング)

次に、特定の目的に合わせて調整します。例えば、子どもが学校で国語や算数を集中的に学ぶようなものです。

AIの場合は、「人間のフィードバックによる強化学習」(RLHF)という方法で、より役立つ回答ができるように調整します。「人に親切に答える」「危険な情報は提供しない」といったルールもこの段階で教えられます。

3. 出力の調整(サンプリング)

AIが実際に答えるとき、「温度」という設定で出力を調整します。温度が低い(0.1など)と、いつも似たような確実な回答になります。温度が高い(1.0など)と、より創造的でバラエティに富んだ回答になります。

また「Top-p」という設定で、確率の高い選択肢だけから言葉を選ぶようにして、変な答えが出ないようにしています。標準では0.9に設定されているんですよ。

AIができることとできないこと

AIの仕組みを知ると、その限界も見えてきます。

AIができること

  • パターンの認識と再現:大量の例から学んだパターンを元に、文章や画像を生成
  • 情報の要約:長い文章の要点をまとめる
  • 言語間の翻訳:学習した言語パターンを基に、別の言語に変換
  • 基本的な質問への回答:学習データの範囲内での知識提供

2024年の最新AIは、テキストだけでなく、画像・音声・動画も同時に扱えるようになっています。例えば、GPT-4 Visionは1024×1024ピクセルの画像を分析でき、物体検出の正確さは92.3%に達しています。また、テキストの生成速度も向上し、GPT-4 Turboは1秒間に約128単語を生成できます。

AIができないこと

  • 本当の「理解」:AIは文脈や確率を扱っているだけで、言葉の本当の意味や感情を理解しているわけではありません
  • 独自の経験:AIは学習データ以外の「実体験」を持たないため、経験に基づく判断はできません
  • 最新情報の把握:例えばGPT-4の知識は2023年12月までの情報に限られています
  • 100%の正確さ:確率的に「もっともらしい」答えを出すため、時々間違えます(これを「幻覚」と呼びます)

最近では「RAG」という技術で、外部の情報源と連携させることで、この「幻覚」の問題を67%も減らすことができるようになりました(Meta AIの研究による)。

[(img)]
▲ AIが「東京オリンピック2024」の画像を作るよう指示されると、実際には存在しない架空の情報に基づいた画像を生成してしまうことがあります(幻覚の例)。

AIをもっと上手に使うために

仕組みを知った今、AIをより効果的に活用するヒントをお伝えします:

1. 明確に指示する

AIは「次に来る言葉を予測する」仕組みであることを思い出してください。曖昧な指示よりも、具体的な指示のほうが良い結果を得られます。

  • △ 「犬について教えて」
  • ◎ 「小学生向けに、犬の種類と特徴を3つ、簡単な言葉で説明して」

2. 間違いに注意する

AIは確率で答えを生成するので、時に自信満々に間違った情報を伝えることがあります。特に最新の出来事や専門的な内容は、必ず別の情報源で確認しましょう。

3. AIの得意・不得意を知る

  • 得意:情報整理、文章作成、アイデア出し、基本的な質問への回答
  • 不得意:事実確認が必要な内容、最新情報、専門的判断が必要な内容

4. エネルギー消費も考える

AIの使用にはエネルギーが必要です。GPT-4で1回の会話(8,000単語程度)をすると、約0.0019kWhの電力を消費します。これは小さな電球を20分つけておくくらいのエネルギーです。必要なときに必要なだけ使うことも大切ですね。

これからのAIはどうなる?

AIの仕組みの基本は変わりませんが、技術は急速に進化しています。2023年から2024年にかけて、AIは次のような進化を遂げました:

  • より多くのデータで学習し、より「賢く」なった
  • テキストだけでなく、画像・音声・動画も同時に処理できるようになった
  • より長い文脈を理解できるようになった(GPT-4では約10万語まで記憶できます)

最近では「EU AI法」という新しいルールもできて、AIが作った画像には「これはAIが作りました」という透かしを入れることが必要になりました。また、他の人の文章や作品を多く使ったときは、その元の作者の名前を表示することもルールになっています。

AIは魔法ではなく、パターンを学習する仕組みに基づいたテクノロジーです。その仕組みと限界を知ることで、AIを便利な道具として上手に活用していきましょう。。。

あなたは、AIの仕組みを子どもに説明できますか?まずは家族や友人に今日学んだことを伝えてみると、理解がさらに深まりますよ。


未来教育パートナーからのお知らせ

AIリテラシーを高めるための「AI基礎知識セミナー」を毎月開催しています。今日の記事で興味を持った方は、ぜひ無料オンラインセミナーにご参加ください。AIの仕組みからプロンプトの書き方まで、実践的なスキルが身につきます。

[AIセミナーの詳細はこちら](無料)

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

一般社団法人 未来教育パートナー
代表理事 甲斐慶彦

マーケティングとAIの掛け算で、事業拡大や業務効率化を支援。
私学の広報支援も手掛け、日本教育を次のステップに進めたい、という情熱のもと当法人を設立。

コメント

コメントする

目次