Meta は 4 月に、AI 業界初のプロジェクトに取り組んでいることを発表しました。これは、OpenAI などの企業が提供する最高の独自モデルと同等のパフォーマンスを備えたオープンソース モデルです。
本日、こちらのモデルが入荷致しました。 Meta は、これまでで最大のオープンソース AI モデルである Llama 3.1 をリリースしました。同社によれば、これはいくつかのベンチマークで GPT-4o や Anthropic の Claude 3.5 Sonnet を上回るパフォーマンスを示しています。 また、Llama ベースの AI アシスタント Meta をより多くの国と言語で利用できるようにするとともに、特定の人物の類似性に基づいて画像を作成できる機能を追加します。 CEO マーク・ザッカーバーグ 彼は今予言する Meta AI は、今年末までに ChatGPT を追い越して最も広く使用されるアシスタントになると予想されています。
Llama 3.1 は、数か月前にリリースされた小型の Llama 3 モデルよりも大幅に複雑です。 最大のバージョンには 4,050 億のパラメータがあり、16,000 個を超える Nvidia の高価な H100 GPU を使用してトレーニングされました。 Meta は Llama 3.1 の開発にどれくらいの費用がかかったのか明らかにしませんでしたが、Nvidia チップのコストだけを基にすると、数億ドルだったと推測するのは安全です。
では、コストを考慮すると、なぜ Meta は数億人のユーザーを抱える企業からの承認のみを必要とするライセンスで Llama を無料で提供し続けるのでしょうか? Meta Company のブログに掲載されたメッセージザッカーバーグ氏は、Linux が今日のほとんどの電話、サーバー、ガジェットに搭載されているオープンソース オペレーティング システムになったのと同じように、オープンソース AI モデルは独自のモデルよりも優れたパフォーマンスを発揮し、すでにより速く改善されていると主張しています。
「ほとんどの開発者が主にオープンソースを使用し始めた業界の転換点。」
同氏は、メタ社のオープンソース AI への投資を以前のオープン コンピューティング プロジェクトと比較しています。このプロジェクトでは、HP などの外部企業を導入してメタ社のデータセンター設計の改善と標準化を支援し、同時に独自の容量を構築することで、同社は「数十億ドル」を節約できたと述べています。 同氏は将来に目を向けて、同じ力学が AI にも展開すると予想し、「ほとんどの開発者が主にオープンソースを使用し始めるため、Llama 3.1 のリリースは業界の転換点になると信じています。」と書いています。
Llama 3.1 を世界に広めるために、Meta は Microsoft、Amazon、Google、Nvidia、Databricks を含む 20 社以上の企業と協力して、開発者が独自のバージョンを展開できるよう支援しています。 Meta は、Llama 3.1 の本番コストは OpenAI の GPT-4o の約半分であると主張しています。 モデルの重みを公開するので、企業はカスタム データでモデルをトレーニングし、好みに合わせて微調整できます。
当然のことながら、Meta は Llama 3.1 のトレーニングに使用したデータについてあまり語っていません。 AI企業で働く人々は、この情報は企業秘密であるため公開しないと主張する一方、批評家らは、今後避けられない著作権訴訟の猛攻を遅らせるための戦術だと主張する。
Metaが言うことは、4,050億個のパラメータを持つLlama 3.1バージョンと、700億個と80億個の小さなバージョンを改善するために、合成データ、つまり人間ではなくモデルによって生成されたデータを使用したということだ。 Meta 社の生成 AI 担当バイスプレジデントであるアーメド・アルダール氏は、Llama 3.1 が「より費用対効果の高い方法で」「展開される小規模なモデルのマイルストーン」として開発者の間で普及すると予想しています。
死んだのかと聞くと彼は同意する コンセンサスが高まりつつある 業界ではモデル用の高品質なトレーニング データが不足しており、アル ダーリ氏は、一部の人が考えているよりも遠いかもしれないが、限界が来ると示唆しています。 「私たちは間違いなくいくつかのことを持っていると考えています [training] 「存在している」と彼は言う。 「でも、言うのは難しいよ。」
Meta の Llama 3.1 に対する積極的なテスト プロセスには、サイバーセキュリティと生化学における潜在的なユースケースの検索が初めて含まれていました。 モデルをより厳密にテストするもう 1 つの理由は、Meta が緊急の「プロキシ」動作と表現しているものです。
たとえば、Al-Dahli 氏によると、Llama 3.1 は検索エンジン API と統合して、「複雑なクエリに基づいてインターネットから情報を取得し、複数のツールを連続して呼び出してタスクを完了する」ことができます。 彼が挙げるもう 1 つの例は、過去 5 年間に米国で販売された住宅数をプロットするようモデルに依頼することです。 「彼は回復できる [web] Python コードを検索して作成し、実行します。
Llama のメタ アプリは独自の AI アシスタントであり、ChatGPT のような汎用チャットボットとして位置付けられており、Instagram、Facebook、WhatsApp のほぼすべての部分で見つけることができます。 今週から、Llama 3.1はまず米国のWhatsAppとMeta AI Webサイト経由で利用可能になり、その後数週間以内にInstagramとFacebookが続く。 フランス語、ドイツ語、ヒンディー語、イタリア語、スペイン語などの新しい言語もサポートするように更新されています。
4,050 億のパラメーターを備えたより高度な Llama 3.1 モデルは Meta AI で無料で使用できますが、アシスタントは、特定の週に不特定多数のプロンプトを通過した後、700 億のパラメーターを備えたより効率的なモデルに切り替えます。 これは、メタがフルスケールで実行するには 4,050 億のモデルが高すぎることを示しています。 同社の広報担当ジョン・カーヴィル氏は、早期使用評価後に保険請求の基準値についてさらに詳しい情報を提供すると語った。
Meta AI の新しい「Imagine Me」機能を使用すると、携帯電話のカメラで顔をスキャンし、生成された写真に画像を挿入できるようになります。 プロフィール上の写真ではなく、この方法で写真を撮影することで、Meta はディープフェイク マシンの作成を回避できると期待されています。 同社は、たとえそれが明らかに本物とそうでないものとの境界線を曖昧にすることを意味するとしても、より AI 主導型のメディアを作成し、それをフィードで共有したいと考える人々からの需要を認識しています。
メタ AI は今後数週間以内に Quest ヘッドセットにも導入され、音声コマンド インターフェイスに代わる予定です。 Ray-Ban の Meta メガネでの実装と同様に、Quest で Meta AI を使用して、ヘッドセットのパススルー モード中に見ているものを識別し、画面を通して現実世界を投影することができます。
「業界全体がまだ製品と市場の適合の初期段階にあると思います。」
今年末までにMeta AIが最も広く使用されるチャットボットになるというザッカーバーグ氏の予測(ChatGPTのユーザー数は1億人を超える)を除けば、Metaはアシスタントの使用状況をまだ公表していない。 「業界全体が、製品と市場の適合に向けてまだ初期段階にあると思います」とアル・ダーリ氏は言う。 AI がどれほど過大評価されているとしても、メタや他のプレイヤーがレースはまだ始まったばかりだと信じていることは明らかです。
「アマチュア主催者。ビールの伝道者になりたい。一般的なウェブファン。認定インターネット忍者。熱心な読者。」
More Stories
第4四半期の米国経済成長率は年率3%と好調に修正された
人工知能チップ大手エヌビディアの株価は、300億ドルという記録的な売上にも関わらず下落した
フォードもハーレーダビッドソン、ディア、ローズに加わりDEIから撤退