言葉は終わりのない雨のように流れます: LLM ニュースで忙しい一週間を総括

ズームイン / 飛んでくる手紙に驚いた少年のポートレート。

AI ニュースには不気味なほど静かな週もあるが、その週の出来事をコントロールすることが流れを食い止めようとしているように感じる週もある。今週は 3 つの注目すべきラージ言語モデル (LLM) リリースがありました: Google Gemini Pro 1.5 一般提供無料利用枠では、OpenAI は次の料金を請求します。新しいコピー GPT-4 Turbo、Mistral は新しいオープンライセンス LLM をリリースしました。ミストラル 8x22B。 3回の打ち上げは火曜日から24時間以内に行われた。

ソフトウェアエンジニアで独立系の AI 研究者である Simon Willison (彼も… に関する本 (Frantic LLM は今週独自のブログで開始されます)、3 つの主要なイベントをそれぞれほぼ時系列順に簡単に説明し、その後、今週追加の AI イベントについて詳しく説明します。

Gemini Pro 1.5 一般リリース

太平洋時間火曜日の朝、Google 発表する Gemini 1.5 Pro モデル (2 月に初めて取り上げました) は現在、Gemini API を介してパブリックプレビューとしてヨーロッパを除く 180 か国以上で利用可能です。これは、Google がこれまでに提供した中で最も強力な一般 LLM 証明書であり、1 日あたり最大 50 件のアプリケーションを許可する無料枠で利用できます。

最大 100 万個の入力コンテキストトークンをサポートします。ウィソンが指摘するように彼のブログでGemini 1.5 Pro の API 価格は、入力コード 1 個あたり 7 ドル、出力コード 1 個あたり 21 ドルで、GPT-4 Turbo よりわずかに安くなります (手頃な値段 100 万ドル当たり 10 ドルの収入、30 ドル /100 万ドルの収入）などクロード 3 ソネット (Anthropic 社の中級 MBA、手頃な値段インバウンド100万あたり3ドル、アウトバウンド100万あたり15ドル）。

Gemini 1.5 Pro には、ユーザーがオーディオまたはビデオプロンプトをアップロードできるネイティブ音声 (音声) 入力処理、ファイルを処理するための新しいファイル API、フォーム応答を指示するためのカスタムシステム命令 (システムプロンプト) を追加する機能が含まれていることは注目に値します。 JSON モード。

「大幅に改良された」GPT-4 Turboの発売。

ズームイン / OpenAI によって提供される GPT-4 Turbo パフォーマンスチャート。

Googleが火曜日に1.5 Proを発表した直後、OpenAIは、「gpt-4-turbo-2024-04」-09と呼ばれるGPT-4 Turbo（もともと11月に発表されたモデルファミリー）の「大幅に改良された」バージョンを公開すると発表した。「これは、マルチモーダル GPT-4 ビジョン処理 (画像コンテンツの認識) をモデルに直接統合しており、最初は API アクセスのみを通じて起動されます。

そして木曜日、OpenAIは、新しいGPT-4 Turboモデルが有料のChatGPTユーザーに利用可能になると発表した。 OpenAIは、新しいモデルにより「文章作成、数学、論理的思考、コーディングの能力」が向上すると述べた。チャートの共有これは能力を判断するのに特に役に立ちません（後に彼らはそうしました）更新しました）。会社もね例を挙げました ChatGPTで書く場合、AIアシスタントは「より直接的で、冗長さが減り、より会話的な言語を使用する」と主張する改善点について述べた。

OpenAI の GPT-4 Turbo 発表の曖昧な性質が一部の人々を惹きつけた混乱そしてネット上での批判。 10日、ウィソン本「本当に役立つリリースノートを公開する最初の LLM プロバイダーは誰でしょうか?」 Cloud 3 のデビュー時に LLM 標準の劣悪な状態について嘆いた記事で説明したように、これはある意味で再び「AI 感情」の事例です。「実際に品質に特に違いは感じられませんでした」 [related to GPT-4 Turbo]」とウィソンはインタビューで直接語った。

このアップデートでは GPT-4 の知識制限も 2024 年 4 月まで拡張されましたが、一部の人々はこれを達成できると報告しています… 隠されたウェブ検索バックグラウンドで他の人がソーシャルメディアを利用している報告された問題歴史に関連した混乱を伴う。

ミストラルミステリーエディションミストラル 8x22B

ズームイン / フランスの国旗を掲げたロボットのイラスト。ミストラルによるフランスの人工知能の台頭を比喩的に反映しています。法学の修士の肖像画を描くのは難しいので、ロボットがそれを行う必要があります。

フランスの人工知能企業ミストラルも負けじと、火曜日の夜、最新のオープンライセンスモデルであるミストラル 8x22B を発売しました。 torrent リンクを含むツイート以前のバージョンと同様、ドキュメントやコメントはありません。

新しい Hybrid Edition of Experts (MoE) は、以前のより高性能なオープンモデルよりも多くのパラメーターを備えています。ミストラル 8x7B、12月に取り上げました。潜在的に GPT-4 と同じくらいの能力があると噂されています (どういう意味ですか? Vibes)。しかし、これはまだ見られていません。

「評価はまだ進行中ですが、現時点での最大の未解決の問題は、Mixtral 22x8B の形状がどの程度良好であるかです」と Willison 氏は Ars に語った。「GPT-4 や Claude 3 Opus と同じ品質クラスであれば、最高の独自モデルに大きく劣らない、オープンライセンスモデルがついに登場することになります。」

このリリースに Willison 氏は非常に興奮し、次のように述べました。「これが本当に GPT-4 なら、（高価な）ラップトップで実行できるので、とんでもないことになります。そのためには 128GB RAM の MacBook が必要だと思います。これは「2 倍」です必要だった。” 所有しています。」

Willison 氏は、Mistral が正確なチャットモデルをまだリリースしていないため、新しい Mixtral ソフトウェアはまだ Chatbot Arena に含まれていないと述べました。これは、次の LLM トークンを予測するためのプロトタイププログラムです。「現在、コミュニティの指導の管理されたバージョンが少なくとも 1 つあります」とウィリソン氏は言います。

READ オーバーウォッチコンテンダーズチームは中流で「ストライキを行う」

チャットボットアリーナのリーダーボードの変更

ズームイン / 2024 年 4 月 12 日に撮影された Chatbot Arena Leaderboard のスクリーンショット。

ビング・エドワーズ

今週の LLM ニュースは、この分野の有名人だけに関するものではありません。ソーシャルメディアでは、Cohere モデルなどのオープンソースモデルのパフォーマンスの向上についての噂もあります。 R+コマンド、どれでも 6位に到達 LMSYS チャットボットアリーナリーダーボード – オープンウェイトモデル史上最高のランキング。

そして、チャットボットアリーナをさらに興奮させるために、GPT-4 Turbo の新バージョンが Claude 3 Opus と競合できることが証明されたようです。この 2 つは依然として統計的には互角ですが、GPT-4 Turbo は最近、前に引っ張った数値的には。 (3 月に、Claude 3 が GPT-4 Turbo で初めてデジタルで首位に立ったときのことを報告しました。これは、他の AI モデルがリーダーボードで GPT-4 ファミリーモデルを破ったのは初めてでした。)

LLM 間のこの熾烈な競争について、密輸業界のほとんどが気づいていないし、これからも起こらないだろうが、ウィルソン氏はアルスに次のように語った。 GPT-4を使って。」今年後半に OpenAI が噂されている GPT-5 の発売によって、かつては乗り越えられないと思われていた同社の技術的リーダーシップが回復するかどうかが分かるだろう、と我々は指摘する。しかし現時点では、「OpenAI はもはや MBA における議論の余地のないリーダーではない」と Willison 氏は言います。

Koga Teruo

「流行に敏感な探検家。受賞歴のあるコーヒーマニア。アナリスト。問題解決者。トラブルメーカー。」

言葉は終わりのない雨のように流れます: LLM ニュースで忙しい一週間を総括

Gemini Pro 1.5 一般リリース

「大幅に改良された」GPT-4 Turboの発売。

ミストラルミステリーエディションミストラル 8x22B

チャットボットアリーナのリーダーボードの変更

GoogleのAndroid用の新しい音声絵文字には「おなら」ボタンが含まれている

Microsoft OpenAI パートナーシップは Google の羨望から生まれました

今後のバットマン: アーカムゲームはメタクエスト独占です

東京ドームって何？日本スタジアムのボクシングヒストリー井上尚弥vs. イラスト：ルイス・ネリ

シェルが利益予想を上回り、35億ドルの自社株買いを開始

スターはその役を断らざるを得なくなった

古いハッブル宇宙望遠鏡が故障から復活

Gemini Pro 1.5 一般リリース

「大幅に改良された」GPT-4 Turboの発売。

ミストラル ミステリー エディション ミストラル 8x22B

チャットボットアリーナのリーダーボードの変更

コメントを残す コメントをキャンセル

More Stories

GoogleのAndroid用の新しい音声絵文字には「おなら」ボタンが含まれている

Microsoft OpenAI パートナーシップは Google の羨望から生まれました

今後のバットマン: アーカム ゲームはメタクエスト独占です

You may have missed

東京ドームって何？ 日本スタジアムのボクシングヒストリー 井上尚弥vs. イラスト：ルイス・ネリ

シェルが利益予想を上回り、35億ドルの自社株買いを開始

スターはその役を断らざるを得なくなった

古いハッブル宇宙望遠鏡が故障から復活

ミストラルミステリーエディションミストラル 8x22B

コメントを残すコメントをキャンセル

今後のバットマン: アーカムゲームはメタクエスト独占です

東京ドームって何？日本スタジアムのボクシングヒストリー井上尚弥vs. イラスト：ルイス・ネリ