Google の Gemini AI が登場しましたが、ChatGPT よりも優れていますか?

クイックリンク

重要なポイント

  • Google の AI モデル Gemini には、異なるタスクと複雑さのレベルに焦点を当てた、Ultra、Pro、Nano の 3 つのバリエーションがあります。
  • Gemini Ultra は主要な AI ベンチマークで有望な結果を示していますが、2023 年 12 月の時点では一般利用はできません。 Googleは2024年1月に利用可能になる予定だとしている。
  • Gemini Pro が利用可能で、パフォーマンスは非常に優れていますが、現時点では GPT-4 の座を奪うことはできません。

Googleは一貫して、同社のGemini AIモデルはChatGPT Plusの原動力となるOpenAIのGPT-4よりも優れていると約束してきた。 Google Gemini がリリースされたので、いよいよテストして、Gemini が GPT-4 とどのように比較されるかを確認することができます。

Google が 2023 年 3 月に Bard を発表したとき、興奮する理由はたくさんありました。最後に、OpenAI の ChatGPT 独占は破られ、価値のある競争が得られるでしょう。

しかし、Bard は人々が期待していた AI の巨人ではなく、GPT-4 が依然として支配的な生成型 AI チャット ボット プラットフォームです。さて、Google の Gemini が登場しました。しかし、待望の AI モデルは ChatGPT よりも優れているのでしょうか?

Gemini は Google の最も有能な生成 AI モデルであり、テキスト、音声、画像、ビデオなどのさまざまなデータ形式を理解して動作できます。これは、最も有能な AI テクノロジーから統合された AI モデル描画機能を作成するという Google の試みです。 Gemini には 3 つのバリエーションが用意されています。

  1. ジェミニウルトラ:非常に複雑なタスクを処理するために設計された、最大かつ最も有能なバリアント。
  2. ジェミニプロ:幅広いタスクにわたってスケーリングして高いパフォーマンスを実現するのに最適なモデルですが、Ultra よりも機能は劣ります。
  3. Gemini Nano:オンデバイスのタスク展開用に設計された最も効率的なモデル。たとえば、開発者は Gemini Nano を使用してモバイル アプリや統合システムを構築し、強力な AI をモバイル空間に導入できます。

公式ブログでは、キーワード, Googleによれば、Gemini Ultraはいくつかのベンチマークで最先端のものを上回っているという。 Google は、Gemini Ultra がいくつかの主要なベンチマークで業界をリードする GPT-4 を上回っていると主張しています。

厳格な MMLU ベンチマークで前例のない 90.0% のスコアを達成した Gemini Ultra は、57 被験者にわたるこの多面的なテストで人間レベルのパフォーマンスを超えた最初のモデルであると Google は述べています。

グーグル

Gemini Ultra は、Go、JavaScript、Python、Java、C++ など、世界で最も人気のあるプログラミング言語のいくつかを理解し、説明し、高品質のコードを生成することもできます。理論上、これらはすべて素晴らしい結果です。しかし、これらはすべてベンチマークであり、ベンチマークが必ずしもすべてを物語るわけではありません。では、双子座は現実世界のタスクでどの程度うまく機能するのでしょうか?

Google Gemini AI の使用方法

Gemini AI モデルの 3 つのバリエーションのうち、Gemini Pro を今すぐ使い始めることができます。 Gemini Pro は現在、Google の Bard チャットボットで利用できます。 Gemini Pro を Bard で使用するには、次のサイトにアクセスしてください。吟遊詩人.google.comGoogle アカウントでサインインします。

Google によれば、Gemini Ultra は 2024 年 1 月に公開される予定であるため、現時点では ChatGPT に対して Gemini Pro をテストすることで解決する必要がありました。

Gemini と GPT-3.5 および GPT-4 の比較

新しい AI モデルが発表されると、OpenAI の GPT AI モデルに対してテストされます。GPT AI モデルは、他のモデルが対抗すべき最先端のモデルとして一般に受け入れられています。そこで、Bard と ChatGPT を使用して、Gemini の数学、創造的な執筆、コード生成、画像入力の正確な処理能力をテストしました。

私たちが考えることができる最も簡単な数学の問題から始めて、両方のチャットボットに解決するように依頼しました。-1×-1×-1

バードが最初に行きました。私たちはその質問を 2 回繰り返しましたが、すべて間違った答えが返ってきました。 3 回目の試行で答えを得ることができましたが、それはカウントされません。

GPT-3.5でChatGPTを動かしてみました。最初の試みは正解でした。

ジェミニの画像解釈能力をテストするために、いくつかの人気のあるミームを解釈するという課題をジェミニに与えました。同社は、人物が写っている画像を解釈することはできないとして断った。 GPT-4V を実行している ChatGPT は、これを完璧に実行する意欲があり、実行できました。

私たちは、問題解決能力とコーディング能力をテストしながら、画像を解釈させるという別の試みを試みました。 Gemini Pro を実行している Bard にスクリーンショットを渡し、スクリーンショットを複製するための HTML と CSS コードを解釈して作成するように依頼しました。

ソースのスクリーンショットは次のとおりです。

以下は、HTML と CSS を使用してスクリーンショットを解釈して複製する Gemini Pro の試みです。

そして、これがスクリーンショットを複製する GPT-4 の試みです。 GPT-4 が歴史的にコーディングに強いことを考えると、この結果は驚くべきことではありません。以前、GPT-4 を使用して Web アプリを最初から構築する方法をデモしました。

私たちは Gemini Pro に、テスラ (電気自動車ブランド) に関する詩の作成を依頼しました。過去に行ったテストからわずかな改善が見られました。結果は次のとおりです。

現時点では、スーパーチャージされた GPT-4 ではなく GPT-3.5 と結果を比較する方が適切であると考えました。そこで、GPT-3.5 を実行している ChatGPT に同様の詩を作成するよう依頼しました。

個人的な選択かもしれませんが、これに対する Gemini Pro の見解の方が優れているように思えます。しかし、私たちはあなたに判断してもらいます。

Gemini は ChatGPT よりも優れていますか?

Google が Bard を立ち上げる前、私たちはこれが待ち望んでいた ChatGPT コンテストになるだろうと考えていましたが、そうではありませんでした。さて、Gemini が登場しましたが、今のところ、Gemini Pro は ChatGPT にノックアウトパンチを与えるモデルとは思えません。

Googleは、Gemini Ultraはさらに改良されるだろうと述べている。私たちは、それがそうなること、そしてそれが Gemini Ultra の発表で述べられた主張を満たすか、それを超えることを心から願っています。しかし、Google の生成 AI ツールの最良のバージョンを見てテストするまでは、それが他の AI モデルの競合他社を打ち負かすことができるかどうかはわかりません。現状では、GPT-4 が議論の余地のない AI モデルのチャンピオンであり続けています。

Related Posts