ChatGPT や Google Bard などの言語ラージ モデル (LLM) を提供できます いくつかの 特定の種類の質問にはまともな答えが得られますが、皮肉なことに、これらのコンピューターはコンピューティングがかなり苦手です。 Google は、言語モデルに数学などの単純なタスクを実行させるための新しいソリューションを開発しました。つまり、AI を入手することです。 プログラムを書く。 Googleによれば、吟遊詩人に数学や文字列操作などの「計算」タスクを依頼すると、言語モデルの出力を表示する代わりに、その言語モデルがプログラムを作成し、そのプログラムを実行して、その出力を表示するという。プログラムをユーザーに答えとして返します。
Google のブログ投稿には、「『ロリポップ』という単語を逆に解釈した」エントリの例が示されています。 ChatGPT はこの質問をひっくり返して、間違った「pillopoL」という答えを返します。言語モデルは世界を単語の断片、つまり「シンボル」で捉えており、この点ではあまり得意ではないからです。 Bard の出力例を次に示します。
「popilloL」として正しい出力が得られますが、さらに興味深いのはそれです。 Pythonコードが含まれています 質問に答えるために書きました。 これは、プログラミングに興味がある人が内部に何があるのかを見るのに最適ですが、まあ、これはおそらく一般の人にとって最も恐ろしい方法です。 特に関連性があるわけでもありません。 Gmail にメールを取得するように要求したときに、コード ブロックが表示された場合を想像してください。 それは奇妙だ。 頼まれた仕事だけをやるだけだよ、クール。
Google は、プログラムを作成する AI モデルを、異なる思考モードであるという点で、長い除算を行う人間に例えています。
このアプローチは、ダニエル・カーネマンの著書で特に取り上げられている、人間の知性におけるよく研究された二元論に触発されています。 速く考えることとゆっくり考えること「システム1」と「システム2」を分けて考える。
- システム 1 の考え方は、速く、直観的で、簡単です。 ジャズミュージシャンがその場で即興演奏するとき、または誰かが単語を考えてそれが画面に表示されるのを見るとき、彼らはシステム 1 の思考を使用しています。
- 対照的に、システム 2 の思考は遅く、慎重で、手間がかかります。 長除法をするとき、または楽器の演奏方法を学ぶときは、システム 2 を使用していることになります。
この例えでは、LLM はシステム 1 の下でのみ動作し、あまり考えずにテキストを迅速に生成すると見なすことができます。 これにより、いくつかの驚くべき機能が実現しますが、いくつかの驚くべき点で不十分になる可能性があります。 (システム 1 だけを使用して数学の問題を解決しようとしていると想像してください。立ち止まって計算を行うことはできません。頭に浮かんだ最初の答えを書き留める必要があるだけです。) 古典的な計算はシステム 1 と密接に連携しています。 2 考え方: これは公式で柔軟性に欠けるプロセスですが、適切な手順の順序により、長い除算の解決策など、印象的な結果につながる可能性があります。
Googleによると、この「コード・オン・ザ・フライ」方式は「15,683,615の素因数は何ですか?」といった質問にも使用されるという。 「私の貯蓄の増加率を計算してください。」 同社は、「これまでのところ、この方法により、社内課題データセット内の数値ベースの単語および数学の問題に対するバードの回答の精度が約 30% 向上することが確認されています。」と述べています。 いつものように、Google は Bard に対し、質問を誤解したり、私たち全員と同じように最初から機能しないコードを書いたりした場合は「正しく理解できないかもしれない」と警告しています。
Bard は現在、答えを急いでコード化しているので、bard.google.com で試してみてください。
「流行に敏感な探検家。受賞歴のあるコーヒーマニア。アナリスト。問題解決者。トラブルメーカー。」
More Stories
Apple Sports アプリでは、iOS 18 の iPhone ロック画面でライブスコアを表示できます
PS5 Proの発表計画とデバイスデザインに関するリーク
悪魔城ドラキュラ ドミナス コレクションの物理的なリリースが決定、予約注文は来月開始