2025年11月19日

Gemini3が登場 - 推論とマルチモーダル能力が大幅進化

Googleより新たなLLM(大規模言語モデル)としてGemini3が発表されました。旧モデルのGemini2.5との進化点からGPTとの比較まで徹底解説します。

松尾庄馬

取締役

2025年11月18日、GoogleはGeminiシリーズの最新アップデートとして「Gemini3」を正式発表しました。従来モデルを総合的に上回る性能を備えた、大幅なアップグレードです。

この記事では、Gemini3の概要と提供状況、進化ポイント、そして実際に使ってみた所感までを丁寧に解説します。機能が増え過ぎて追いきれないという方も、ここだけ読めば要点を把握できます。

株式会社 Digeonは、APIを介してユーザーのデータがAIの学習に利用されることなく、セキュアに安心してご利用いただけるサービスである「ENSOUチャットボット」を提供しています。

無料ですぐに使えるフリープランのご利用開始はこちらから👇

ENSOU Chatbot

chatbot.ensou.app

他のモデルを凌駕するGemini3

Gemini 3 は最先端の推論能力を備え、従来バージョンと比較して、主要な AI ベンチマーク（性能評価指標）のほぼすべてで優れた結果を示しています。

Google によれば、博士号レベルの知能を持つモデルだと説明されています。

以下の画像では、各種ベンチマーク結果が表形式で示されています。太字になっている箇所が、その試験項目で最も高いパフォーマンスを記録したモデルです。

新たに発表された「Gemini 3 Pro」は、ほぼ全てのテスト項目において、他モデルと同等かそれ以上の性能を示しています。

Gemini3と主要モデルのベンチマーク比較表。ほぼ全ての項目でGemini3 Proが上位を占めている — 出典元:https://blog.google/products/gemini/gemini-3/#gemini-3

優れた推論能力を発揮 - Gemini 3 Deep Think

Gemini 3 Deep Think は、Humanity’s Last Exam（人類最後の試験）などのベンチマークにおいて、その高い推論能力を生かし、これまでに例のないパフォーマンスを達成しました。

この「人類最後の試験」は、あらゆる分野の超難問を集めたテストで、人類の叡智を結集して設計されたと言われる非常に難度の高い試験です。この超高難度ベンチマークで他モデルに大きく差をつけていることからも、Gemini 3 の圧倒的な推論力がうかがえます。

Gemini3DeepThinkの他のモデルとの性能比較グラフ — 引用元:https://blog.google/intl/ja-jp/company-news/technology/gemini-3/#learn-anything

LMArenaでも１位を獲得

ユーザーに対してモデル名を伏せた状態で複数の AI を使ってもらい、「どちらが良かったか」に投票してもらう形式で人気を競う評価プラットフォームとして「LMArena」というものがあります。こちらでも、Gemini 3 はライバルモデルを抑えて首位を獲得しました。

この結果から、単にベンチマークの数値が優れているだけでなく、実際にユーザーが使ってみたときの「体感的な賢さ」という観点でも高く評価されていることが分かります。

LMArenaでの比較表、首位をとるGemini 3 Pro — 引用元:https://lmarena.ai/leaderboard

日本でのGemini 3の提供状況

Gemini 3 は、一般ユーザー向け・開発者向け・エンタープライズ向けに順次提供が開始されます。

Gemini 3 Pro は一部制限付きながら無料版でも利用可能です。有料版ユーザー（Pro、 Ultra）の方は、これまでと同じ感覚で、そのまま Gemini 3 Pro を利用できます。

圧倒的なマルチモーダル性能

Gemini シリーズは Gemini 2.5 の時点からマルチモーダル処理に強みがありました。マルチモーダルとは、異なる種類の情報を統合して処理する仕組みを指します。たとえば、カメラで撮影した映像とマイクで録音した音声のように、性質の異なる情報を一括で理解する能力のことです。

Gemini 3 ではこのマルチモーダル性能がさらに向上し、複数の情報源を組み合わせても、より自然でシームレスな応答が得られるようになりました。たとえば以下のような使い方ができます。

手書きメモを撮影した写真から内容を自動で読み取り、テキストとして整理する
論文・講義動画・講義資料を読み込ませると、学習用のフラッシュカードを自動生成する

これにより、テキスト入力が中心だった従来の生成 AI と比べて、より直感的で使いやすくなっています。

優れたゼロショット生成で単純なアプリを瞬時に生成

Gemini 3 はゼロショット生成能力が大幅に強化されており、適切なプロンプトを与えるだけで動画のデモンストレーションでも紹介されているような簡易 3D ゲームを動画レベルのクオリティで生成できます。

コードの下書きや構成案を用意しなくても、自然言語の指示だけでアプリの形がその場で立ち上がるため、開発の初速が劇的に高まります。

この記事の後半にある「ゼロショット生成で簡単なアプリを作ってみる」で、実際にユーザーが作れるのかを検証していきます。

実際の使用感

知りたい情報をアニメーション付きでわかりやすく学ぶ

動画のデモでは、Google 検索の AI モードが提供する生成 UI を使い、RNA ポリメラーゼの仕組みをアニメーション付きで理解できる様子が紹介されていました。

実際に同じ操作を試してみましたが、現時点ではこの機能はまだ利用できないようで、デモと同じ体験を再現することはできませんでした。デモで使用されていた画面表示と比べると表示が異なっていたため、アップデートがまだ配信されていない可能性が高そうです。正式な一般公開が待ち遠しいところです。

ゼロショット生成で簡単なアプリを作ってみる

次に、ゼロショット生成の実力を検証するために、以下のような非常にシンプルなプロンプトを投げてみました。

テトリスのような簡単なゲームを作ってください。

この一文だけで、即座にコード生成が開始されます。

実際にできたゲームがこちらになります。

実際にプレイ可能で、ブロックの落下や操作も問題なく動作しました。

自然言語の一言だけで、コードを書く必要もなく、修正依頼すら不要でここまで動くゲームが生成されるのは非常に驚きです。

今回はゲームを題材にしましたが、業務の中で使う簡易的な自動化ツール作成程度であれば、同じ手法で短時間に構築できるでしょう。

直感的かつスピーディにプロトタイプを作れるという点で、コードや読めない人だけでなく開発者にも大きな利点があると感じました。

まとめ

Gemini 3 の完成度は非常に高く、多くの領域で他モデルを凌駕する結果となりました。

特に推論性能とマルチモーダル処理は着実に強化されています。画像・映像・音声・テキストをまたいで統合的に理解し、自然な応答を返せる点は他モデルと比較してもGeminiの方が良いと感じる場面がありました。発表会で示されていたアニメーション付きの説明機能こそ現時点では再現できませんでしたが、これが一般ユーザーでも利用できるようになれば、単なるAIのツールとして使うだけでなく、勉強内容を気軽に聞ける相棒となるでしょう。

また、ゼロショット生成による簡易アプリの自動構築には特に感動しました。エラーなく一発で動くものが一言でできるということを実際に体験して、ビジネスの現場でもアイデア検証や業務自動化ツールの試作が圧倒的なスピードで実現できるだろうと感じました。

一方で、生成内容には誤情報や不正確さが含まれる可能性があるので、高度になったとはいえ万能ではないため、最終的な判断はあくまで人間が行い、利用目的に応じて適切な検証を挟むことが重要です。

株式会社Digeonは、法人向けに生成AI活用のファーストステップに最適なサービスである「ENSOUチャットボット」を提供しています。

ENSOUチャットボットでは、AIにデータが学習されるリスクなく、また情報漏洩に関しても厳重に管理され、安心して生成AIの活用を始められます。

ご相談、無料トライアルは、以下からお問い合わせください👇