5月 18, 2024

kenmin-souko.jp

日本からの最新ニュースと特集:ビジネス、政治、解説文化、ライフ&スタイル、エンターテインメント、スポーツ。

Googleは、最大かつ最も有能なAIモデル「Gemini」を発表した

Googleは、最大かつ最も有能なAIモデル「Gemini」を発表した

2023年11月16日にカリフォルニア州サンフランシスコのモスコーニウエストで開催されたアジア太平洋経済協力会議(APEC)CEOサミットで、GoogleのCEOサンダー・ピチャイ氏がエミリー・チャン氏と対談。 APEC首脳会議はサンフランシスコで開催され、11月17日まで続く。

ジャスティン・サリバン | ゲッティイメージズニュース | ゲッティイメージズ

人工知能を収益化する方法を求めるプレッシャーが同社に高まる中、グーグルは水曜日、同社が最大かつ最も有能だと考える人工知能モデルを発表する。

大型の Gemini モデルには 3 つの異なるサイズが含まれます。Gemini Ultra は最大かつ最も機能的なカテゴリです。 Gemini Pro は、幅広いタスクに対応します。 Gemini Nano は、特定のモバイル タスクとデバイスに使用されます。

現時点では、同社は Google Cloud を通じて顧客に Gemini のライセンスを供与し、顧客が独自のアプリケーションで使用できるようにする予定です。 12 月 13 日より、開発者と企業顧客は、Google AI Studio の Gemini API を介して Gemini Pro にアクセスできるようになります。 Google Cloud Vertex AI。 Android 開発者も Gemini Nano を使用して構築できるようになります。 Gemini は、Bard チャットボットや検索クエリに会話テキストで答えようとする Search Geneative Experience などの Google 製品を強化するためにも使用されます (SGE はまだ広く利用可能ではありません)。

Gemini Ultra は人間の専門家を上回る性能を発揮した最初のモデルです MMLU (大規模マルチタスク言語理解)は、数学、物理学、歴史、法律、医学、倫理などの57科目を組み合わせて世界知識と問題解決能力の両方をテストするものである、と同社は水曜日のブログ投稿で述べた。 彼らは、複雑なトピックのニュアンスと論理を理解する必要があります。

2023年5月10日水曜日、米国カリフォルニア州マウンテンビューで開催されたGoogle I/O開発者カンファレンスに参加したAlphabet Inc. CEOのSundar Pichai氏。

デビッド・ポール・モリス | ブルームバーグ | ゲッティイメージズ

「Gemini は、Google Research の同僚を含む Google 全体のチームによる広範な共同作業の結果です」と CEO の Sundar Pichai 氏は水曜日のブログ投稿で述べています。 「これは、マルチモーダルになるようにゼロから設計されています。つまり、テキスト、コード、オーディオ、画像、ビデオなど、さまざまな種類の情報をシームレスに一般化し、理解し、連携し、統合することができます。」

本日より、Google のチャットボット Bard は Gemini Pro を使用して、高度な思考、計画、理解、その他の機能を支援します。 幹部らは火曜日の記者団との電話会議で、来年初めにGemini Ultraを使用する「Bard Advanced」を発売する予定だと述べた。 これは、ChatGPT 風のチャットボットである Bard への最大のアップデートを表します。

このアップデートは、検索大手の Bard が最初にリリースしてから 8 か月後、OpenAI が GPT-3.5 で ChatGPT をリリースしてから 1 年後に行われます。 今年3月、サム・アルトマン氏率いるスタートアップ企業がGPT-4を立ち上げた。 幹部らは火曜日、Gemini Proの性能はGPT-3.5を上回ったが、GPT-4と比べてどうなのかという質問は避けたと述べた。

Googleが「Bard Advanced」へのアクセスに料金を請求する計画があるかとの質問に対し、GoogleのBard担当ゼネラルマネジャー、シシー・シャオ氏は、優れたエクスペリエンスを生み出すことに重点を置いており、収益化の詳細はまだ決まっていないと述べた。

記者会見で、Gemini には現世代の LLM 保有者と比較して新しい機能があるかと尋ねられたとき、Google DeepMind の製品担当副社長である Eli Collins 氏は、「あると思います」と述べましたが、Gemini Ultra の新しい機能を理解するためにまだ努力中です。能力。

グーグルは言った 遅延 Gemini は準備が整っていなかったために立ち上げられましたが、年初に同社が AI ツールを発表したときの困難な状況が思い出されます。

何人かの記者が遅れについて質問したが、コリンズ氏は、より高度なモデルのテストには時間がかかると答えた。 コリンズ氏は、Geminiは同社が構築したAIモデルの中で最もテストされており、Googleのモデルの中で「最も包括的な安全性評価」を行っていると述べた。

コリンズ氏によると、ジェミニ ウルトラは同社最大のモデルであるにもかかわらず、サービス料金がはるかに安いという。 「機能が向上しただけでなく、効率も向上しました」と彼は言いました。 「Gemini をトレーニングするにはまだ多くのコンピューティングが必要ですが、これらのモデルをトレーニングする能力はより効率的になりつつあります。」

コリンズ氏は、同社はこのモデルの詳細を記載した技術白書を水曜日に発表すると述べたが、海洋番号は発表しないと述べた。 今年初め、CNBCは、当時最先端のAIモデルであるGoogleのPaLM 2大規模言語モデルが、その前身であるLLMの5倍近くの量のテキストデータをトレーニングに使用していたことを発見した。

また水曜日、GoogleはAIモデルをトレーニングするための次世代テンソル処理ユニットを発表した。 Googleは、Salesforceと新興企業Lightricksが使い始めたTPU v5pチップは、2021年に発表されたTPU v4チップと比較して、価格の割に優れたパフォーマンスを提供すると述べた。しかし同社は、市場リーダーと比較したパフォーマンスに関する情報を提供しなかった。 、エヌビディア。

このチップの発表は、クラウドのライバルであるAmazonとMicrosoftが人工知能をターゲットにしたカスタムシリコンを披露した数週間後に行われた。

Googleが10月に行った第3四半期決算の電話会議では、投資家らは経営陣に対し、AIを実際の利益に変える方法についてさらなる質問をした。

8月、Googleは「初期実験」を開始した。 産科の専門知識に関する研究、または SGE は、ユーザーが検索エンジンを使用したときに生成 AI エクスペリエンスがどのようなものになるかを確認できるようにします。検索は依然として同社の主要な利益センターです。 その結果、チャットボットの時代を反映して、より多くの会話が可能になります。 ただし、これはまだ実験段階であり、一般公開はされていません。

投資家らは、同社が年次Google I/O開発者カンファレンスで初めてトライアルを発表した5月以来、SGEのスケジュールを求める声を上げてきた。 水曜日のジェミニの発表ではSGEについては言及されておらず、幹部らは一般公開する計画については曖昧で、ジェミニは「来年には」SGEに統合されると述べた。

ピチャイ氏は水曜日のブログ投稿で、「このモデリングの新時代は、当社が企業として取り組んできた科学的および工学的取り組みの中で最大規模の一つを表している」と述べた。 「私はこれから何が待ち受けているのか、そしてジェミニが世界中の人々にどんな機会を開くのか、とても楽しみにしています。」

— CNBC の Jordan Novet がこのレポートに寄稿しました。

CNBC PRO からの次のストーリーをお見逃しなく。

READ  災害対応と救援活動における AI ロボットの役割