広く使用されているチャットボット ChatGPT は、詩から研究論文、コンピューター プログラムに至るまで、あらゆるデジタル テキストを作成するように設計されています。 しかし、コンピュータチップ会社エヌビディアの人工知能研究者チームがチャットボットの基礎技術を手に入れたとき、それがもっと多くのことができることに気づいた。
数週間以内に、彼らは彼に、世界で最も人気のあるビデオ ゲームの 1 つである Minecraft の遊び方を教えました。 Minecraft のデジタル世界の中で、私は泳ぎ、植物を集め、豚を狩り、金を採掘し、家を建てることを学びました。
「彼は、Minecraft の世界に入り、自分で探検し、自分で材料を集め、あらゆる種類のスキルを向上させることができます」と、ジムとして知られる Nvidia の上級研究員である Linxi Fan 氏は述べています。
プロジェクト これは、世界をリードする AI 研究者がチャットボットを AI エージェントと呼ばれる新しいタイプの自律システムに変えようとしている初期の兆候でした。 これらのエージェントはチャット以上のことを行うことができます。 ソフトウェア アプリケーション、Web サイト、およびスプレッドシート、オンライン カレンダー、旅行 Web サイトなどのその他のオンライン ツールを使用できます。
多くの研究者は、時間の経過とともに、AI エージェントがより高度になり、オフィスワーカーに取って代わり、ほぼすべての管理機能を自動化できる可能性があると述べています。
「これは潜在的に数兆ドルの価値がある、巨大なビジネスチャンスだ」とブリティッシュコロンビア大学のコンピューターサイエンス教授、ジェフ・クルーン氏は語る。彼は以前、サンフランシスコの新興企業OpenAIの研究者としてこの種の技術に取り組んでいた。テクノロジー。 チャットGPT。 「これは社会にとって大きなプラス面と深刻な結果をもたらします。」
ゲームをプレイしている Nvidia エージェント。 同様のエージェントは、会議のスケジュール設定、ファイルの編集、データの分析、複数色の棒グラフの作成を行うことができます。 その考えは、これらの自動化システムが最終的には幅広いオンライン タスクを処理できるパーソナル アシスタントとして機能するようになるということです。
今日のエージェントは限られており、あなたの生活を正確に整理することはできません。 ChatGPT は旅行サイト Expedia でニューヨーク行きの航空券を検索できますが、予約は自分で行う必要があります。
このテクノロジーは、研究者が改良すれば、オフィスワーカーや消費者の効率が向上する可能性があります。 また、ビデオ ゲームの性質を変え、プレイヤーが一緒にプレイしたりチャットしたりできるボットの新しい波をもたらす可能性もあります。
ChatGPT を強化するテクノロジーである GPT-4 は、研究者がグランド言語モデルと呼んでいるものです。 膨大なデータを分析してスキルを学習する人工知能システムです。
過去数か月間、このテクノロジーは、電子メールを作成し、スピーチを書き、ほぼあらゆるトピックについて歌を歌う方法で何億人もの人々を驚かせてきました。 しかし、彼の最も重要なスキルは、コンピューター プログラムを書く才能かもしれません。
彼は、ユニコーンを描いたり、ラップトップの画面に雪の結晶をデジタル的に落としたりするプログラムを瞬時に作成できます。 プロのソフトウェア開発者は、ソーシャル メディア アプリから検索エンジンに至るまで、より大きなプログラムに統合できるコードを委託できます。 しかし、これはこのテクノロジーができることの一部にすぎません。 他のソフトウェア アプリケーションや Web サイトで使用できるコンピューター コードを生成することもできます。
これは、ファン博士と他の Nvidia 研究者が GPT-4 に Minecraft のプレイ方法を教えた方法です。 「ここで最も重要な言葉はコードです」とファン博士は言いました。 「コードはアクションを実行できます。」
ユーザーは、ボタン、メニュー、その他のグラフィック ツールに触れることによって、ソフトウェア アプリケーションや Web サイトを使用します。 AI エージェントは、アプリケーション プログラミング インターフェイス (API) (他のオンライン サービスとの通信を可能にする基盤となるソフトウェア コード) にアクセスして、アプリや Web サイトを使用します。
たとえば、エージェントにビデオをインターネットにアップロードするように依頼すると、YouTube が提供するアプリケーション プログラミング インターフェイス (API) と呼ばれるコードを生成できます。 「API は、マシンと通信するために使用される単なるテキストです」と、自律型 AI エージェント プロジェクト AutoGPT の運営を支援する研究者のセリン ナイヒン氏は述べています。
理論的には、チャットボットはインターネット上の任意の API にアクセスするコードを作成できます。 しかし、今日のチャットボットは、単純なタスク以上のことを実行できるほどのスキルを備えていません。 たとえそうだとしても、オンラインで自由に移動できるようにすることは、セキュリティ上の大きなリスクとなるでしょう。 そこで、会社は小規模にスタートしました。
OpenAI が ChatGPT を発表してから数か月後、チャットボットが単にテキストを生成する以上のことを行う方法を密かにリリースしました。 ボットの機能を拡張するソフトウェアであるいくつかのプラグインをインストールすると、エクスペディアなどの旅行サイトで利用可能な航空券を検索したり、Google Earth から都市の地図を取得したり、年間支出の詳細を示すスプレッドシートを変換したりすることができます。 .. 多色の棒グラフ。
ChatGPTにはコードコンパイラと呼ばれるプラグインが付属しているため、コードを書くだけでなく実行することもできます。 これにより、スプレッドシートの編集や静止画像の動画への変換など、これまでは実行できなかったタスクを瞬時に実行できるようになりました。 Google、Microsoft、その他の企業も同様のテクノロジーを検討しています。
「これらは、AI が基本的にユーザーに代わって他の AI と連携することを想定したプロジェクトです」とマイクロソフトの副社長、アシュリー ローレンスは述べています。
AutoGPT のような独立したプロジェクトは、この種のことをさらに数歩進めようとしています。 そのアイデアは、システムに「会社を設立する」や「お金を稼ぐ」などの目標を与えることです。 次に、自分自身に質問したり、他のインターネット サービスに接続したりすることで、その目標を達成する方法を探します。
今日では、これはあまりうまくいきません。 AutoGPT のようなシステムは、無限ループに陥る傾向があります。 しかし、ファン博士のような研究者は、この種のテクノロジーをより便利で信頼性の高いものにするために、常に改良に取り組んでいます。
他の研究者は、ソフトウェア ツールを使用するように設計された新しいタイプの人工知能エージェントを構築しています。 2022 年の夏、クルーン博士は、これを実行できるエージェントを構築した OpenAI の研究者チームの一員でした。 人間と同じようにコンピュータープログラムを使用する – マウスクリックに次ぐマウスクリック、キーストロークに次ぐキーストローク。
クルーン博士と彼の同僚は、人々が Minecraft をプレイしている様子を映した何時間ものオンライン ビデオをシステムに供給しました。 ユーザーがマウスとキーボードを使用して Minecraft のデジタル世界を移動する方法を分析することで、システムはゲームを独自に実行する方法を学習しました。
Adeptと呼ばれるスタートアップを含む他の企業も構築中です 類似のエージェント これは、Wikipedia、Redfin、Craigslist などの Web サイトや、Salesforce などの企業の人気のあるオフィス アプリケーションを使用します。
クルーン博士は、このタイプのエージェントにより、最終的には AI がより広範囲のソフトウェア アプリケーションや Web サイトを使用できるようになるだろうと述べています。 誰もがインターネット上でほぼ何でもできるデジタルアシスタントにアクセスできるようになる、と同氏は述べた。 これにより生活が楽になるだけでなく、無数の仕事が置き換えられる可能性もあります。
「私たちにできることをAIができるとしたら、それは単に退屈な作業を置き換えるだけではありません」と彼は言う。 「すべてのタスクを置き換えます。」
「流行に敏感な探検家。受賞歴のあるコーヒーマニア。アナリスト。問題解決者。トラブルメーカー。」
More Stories
Apple Sports アプリでは、iOS 18 の iPhone ロック画面でライブスコアを表示できます
PS5 Proの発表計画とデバイスデザインに関するリーク
悪魔城ドラキュラ ドミナス コレクションの物理的なリリースが決定、予約注文は来月開始