前回は、Transformerと脳の記憶プロセスとの関連について解説してきました。
ChatGPTをはじめとする大規模言語モデルは、その驚くべき言語能力で世界を驚かせています。ChatGPTに犬について尋ねれば、犬の特徴や行動、飼育方法など、まるで犬の専門家のように詳細に答えてくれるでしょう。しかし、ChatGPTは本当に犬を理解しているのでしょうか?この疑問は、人工知能における根本的な問題、「記号接地問題」につながっています。
今回の記事では、記号接地問題とは何か、そしてそれがChatGPTにどのように関係しているのかを探ります。さらに、この問題を克服するための方策と、言語モデルだけで実世界のタスクを行える可能性についても議論したいと思います。
ChatGPTの犬に関する知識
ChatGPTに「犬とは何か?」と質問してみましょう。すると、ChatGPTは犬の外見的特徴(しっぽを振る、鼻が利く、など)や鳴き声(ワンワン、クンクン、など)、犬種の多様性、そして人間との関係性(ペットや番犬として飼われている、など)について、事細かに説明してくれるはずです。
ここからわかるのは、ChatGPTが犬について膨大な知識を持っているということです。また、犬を表す別の言葉(イヌ、ドッグ、など)も知っているでしょう。つまり、ChatGPTは「犬」という言葉が指し示す実体(リアルな犬)と、それを表す記号(言葉)の関係を理解しているようです。
言い換えれば、ChatGPTは「犬」という概念を獲得しているといえます。これは、ChatGPTの基盤であるTransformerが、大量のテキストデータから「犬」という単語と、「ペット」「しっぽ」「嗅覚」「忠実」などの単語の関連性を学習したためです。こうした単語の関連性のネットワークが、ChatGPTの中で「犬」という概念を形作っているのです。
記号接地問題とは
しかし、ここで問題があります。ChatGPTが持つ「犬」の概念は、あくまで言語的なものだということです。ChatGPTは実際の犬を見たり、触ったり、犬の鳴き声を聞いたりした経験がありません。つまり、ChatGPTの「犬」の概念は、現実世界の犬とは切り離されているのです。
この問題は、人工知能分野で「記号接地問題(Symbol Grounding Problem)」と呼ばれています。記号接地問題とは、AIが記号(言葉)を操作することはできても、その記号が指し示す実世界の事物・概念と結びついていないという問題です。
例えば、犬について多くの知識を持つChatGPTですが、実際の犬を目の前にしても、それが犬だと認識することはできません。なぜなら、ChatGPTは犬の画像を理解する能力を持っていないからです。つまり、ChatGPTの「犬」の概念は、現実の犬から「接地」されていないのです。
この記号接地問題は、人工知能が人間のような知能を獲得する上での大きな障壁と考えられてきました。ChatGPTは言語能力においては人間に近づいていますが、記号接地問題という点では、従来のAIと同じ限界を抱えているといえるでしょう。
世界モデルとの統合
では、記号接地問題を克服するにはどうすればよいのでしょうか?1つの方法は、言語モデルであるChatGPTを、実世界を理解する別のAI(世界モデル)と統合することです。
世界モデルとは、センサーを通じて実世界のデータを取り込み、そこから世界の法則性を学習したAIのことです。例えば、画像認識AIや、ロボットに搭載された物体検出AIなどがこれにあたります。
言語モデルと世界モデルを組み合わせることで、言語的な知識と実世界の知識を結びつけることができます。つまり、ChatGPTが持つ「犬」の概念を、現実の犬に「接地」できるのです。
例えば、犬の画像を理解できる世界モデルと統合されたChatGPTであれば、実際の犬の写真を見せると、それが犬であると認識し、その犬種や特徴を言語で説明できるようになるでしょう。
言語モデルだけで実世界のタスクが可能?
ただし、最近の研究では、必ずしも世界モデルとの統合を待たずとも、言語モデルだけである程度実世界のタスクを行える可能性が示唆されています。
例えば、ChatGPTのような言語モデルを用いて、ロボットに自然言語で指示を与え、タスクを実行させる研究が進められています。この場合、言語モデルはタスクの手順を言語的に理解し、ロボットはその指示に従って行動します。
つまり、言語モデルが実世界についての知識を直接持っていなくても、言語を介して実世界との間接的なインタラクションが可能になるのです。
もちろん、この方法にも限界はあります。例えば、言語モデルが理解できない状況が発生した場合、ロボットは適切な行動ができなくなるでしょう。それでも、言語モデルと実世界をつなぐ新しいアプローチとして注目に値します。
まとめ
ChatGPTは「犬」について多くのことを語れますが、その知識はあくまで言語的なものであり、実在の犬とは切り離されています。これが記号接地問題です。
この問題を根本的に解決するには、言語モデルと世界モデルの統合が必要でしょう。しかし、言語モデルだけで実世界のタスクを行える可能性も出てきました。
記号接地問題は、人工知能が人間のような知能を獲得する上での大きな課題ですが、同時に、言語と世界の関係性という哲学的な問いも投げかけています。
ChatGPTの登場は、こうした問題を改めてクローズアップする契機となりました。ChatGPTの「知性」の真の姿を探ること。それは、人工知能のみならず、人間の知性の本質を問う旅でもあるのです。
次回は、人工知能(AI)における「宝くじ仮説」ついて解説していきます。