2025年11月19日

Gemini3が登場 - 推論とマルチモーダル能力が大幅進化

Googleより新たなLLM(大規模言語モデル)としてGemini3が発表されました。 旧モデルのGemini2.5との進化点からGPTとの比較まで徹底解説します。

松尾庄馬
松尾庄馬
取締役
Gemini3が登場 - 推論とマルチモーダル能力が大幅進化

2025年11月18日、GoogleはGeminiシリーズの最新アップデートとして「Gemini3」を正式発表しました。従来モデルを総合的に上回る性能を備えた、大幅なアップグレードです。

この記事では、Gemini3の概要と提供状況、進化ポイント、そして実際に使ってみた所感までを丁寧に解説します。機能が増え過ぎて追いきれないという方も、ここだけ読めば要点を把握できます。

株式会社 Digeonは、APIを介してユーザーのデータがAIの学習に利用されることなく、セキュアに安心してご利用いただけるサービスである「ENSOUチャットボット」を提供しています。

無料ですぐに使えるフリープランのご利用開始はこちらから👇

他のモデルを凌駕するGemini3

Gemini 3 は最先端の推論能力を備え、従来バージョンと比較して、主要な AI ベンチマーク(性能評価指標)のほぼすべてで優れた結果を示しています。

Google によれば、博士号レベルの知能を持つモデルだと説明されています。

以下の画像では、各種ベンチマーク結果が表形式で示されています。太字になっている箇所が、その試験項目で最も高いパフォーマンスを記録したモデルです。

新たに発表された「Gemini 3 Pro」は、ほぼ全てのテスト項目において、他モデルと同等かそれ以上の性能を示しています。

Gemini3と主要モデルのベンチマーク比較表。ほぼ全ての項目でGemini3 Proが上位を占めている
出典元:https://blog.google/products/gemini/gemini-3/#gemini-3

優れた推論能力を発揮 - Gemini 3 Deep Think

Gemini 3 Deep Think は、Humanity’s Last Exam(人類最後の試験)などのベンチマークにおいて、その高い推論能力を生かし、これまでに例のないパフォーマンスを達成しました。

この「人類最後の試験」は、あらゆる分野の超難問を集めたテストで、人類の叡智を結集して設計されたと言われる非常に難度の高い試験です。この超高難度ベンチマークで他モデルに大きく差をつけていることからも、Gemini 3 の圧倒的な推論力がうかがえます。

Gemini3DeepThinkの他のモデルとの性能比較グラフ
引用元:https://blog.google/intl/ja-jp/company-news/technology/gemini-3/#learn-anything

LMArenaでも1位を獲得

ユーザーに対してモデル名を伏せた状態で複数の AI を使ってもらい、「どちらが良かったか」に投票してもらう形式で人気を競う評価プラットフォーム として「LMArena」というものがあります。こちらでも、Gemini 3 はライバルモデルを抑えて首位を獲得しました。

この結果から、単にベンチマークの数値が優れているだけでなく、実際にユーザーが使ってみたときの「体感的な賢さ」という観点でも高く評価されていることが分かります。

LMArenaでの比較表、首位をとるGemini 3 Pro
引用元:https://lmarena.ai/leaderboard

日本でのGemini 3の提供状況

Gemini 3 は、一般ユーザー向け・開発者向け・エンタープライズ向けに順次提供が開始されます。

Gemini 3 Pro は一部制限付きながら無料版でも利用可能です。有料版ユーザー(Pro、 Ultra)の方は、これまでと同じ感覚で、そのまま Gemini 3 Pro を利用できます。

圧倒的なマルチモーダル性能

Gemini シリーズは Gemini 2.5 の時点からマルチモーダル処理に強みがありました。マルチモーダルとは、異なる種類の情報を統合して処理する仕組みを指します。たとえば、カメラで撮影した映像とマイクで録音した音声のように、性質の異なる情報を一括で理解する能力のことです。

Gemini 3 ではこのマルチモーダル性能がさらに向上し、複数の情報源を組み合わせても、より自然でシームレスな応答が得られるようになりました。たとえば以下のような使い方ができます。

  • 手書きメモを撮影した写真から内容を自動で読み取り、テキストとして整理する
  • 論文・講義動画・講義資料を読み込ませると、学習用のフラッシュカードを自動生成する

これにより、テキスト入力が中心だった従来の生成 AI と比べて、より直感的で使いやすくなっています。

優れたゼロショット生成で単純なアプリを瞬時に生成

Gemini 3 はゼロショット生成能力が大幅に強化されており、適切なプロンプトを与えるだけで動画のデモンストレーションでも紹介されているような簡易 3D ゲームを動画レベルのクオリティで生成できます。

コードの下書きや構成案を用意しなくても、自然言語の指示だけでアプリの形がその場で立ち上がるため、開発の初速が劇的に高まります。

この記事の後半にある「ゼロショット生成で簡単なアプリを作ってみる」で、実際にユーザーが作れるのかを検証していきます。

実際の使用感

知りたい情報をアニメーション付きでわかりやすく学ぶ

動画のデモでは、Google 検索の AI モードが提供する生成 UI を使い、RNA ポリメラーゼの仕組みをアニメーション付きで理解できる様子が紹介されていました。

実際に同じ操作を試してみましたが、現時点ではこの機能はまだ利用できないようで、デモと同じ体験を再現することはできませんでした。デモで使用されていた画面表示と比べると表示が異なっていたため、アップデートがまだ配信されていない可能性が高そうです。正式な一般公開が待ち遠しいところです。

デモ通りに表示されない画面
2025年11月19日時点での筆者の検索画面

ゼロショット生成で簡単なアプリを作ってみる

次に、ゼロショット生成の実力を検証するために、以下のような非常にシンプルなプロンプトを投げてみました。

テトリスのような簡単なゲームを作ってください。

この一文だけで、即座にコード生成が開始されます。

ゲームのコードを生成中の画面

実際にできたゲームがこちらになります。

実際にプレイ可能で、ブロックの落下や操作も問題なく動作しました。

自然言語の一言だけで、コードを書く必要もなく、修正依頼すら不要でここまで動くゲームが生成されるのは非常に驚きです。

今回はゲームを題材にしましたが、業務の中で使う簡易的な自動化ツール作成程度であれば、同じ手法で短時間に構築できるでしょう。

直感的かつスピーディにプロトタイプを作れるという点で、コードや読めない人だけでなく開発者にも大きな利点があると感じました。

まとめ

Gemini 3 の完成度は非常に高く、多くの領域で他モデルを凌駕する結果となりました。

特に推論性能とマルチモーダル処理は着実に強化されています。画像・映像・音声・テキストをまたいで統合的に理解し、自然な応答を返せる点は他モデルと比較してもGeminiの方が良いと感じる場面がありました。発表会で示されていたアニメーション付きの説明機能こそ現時点では再現できませんでしたが、これが一般ユーザーでも利用できるようになれば、単なるAIのツールとして使うだけでなく、勉強内容を気軽に聞ける相棒となるでしょう。

また、ゼロショット生成による簡易アプリの自動構築には特に感動しました。エラーなく一発で動くものが一言でできるということを実際に体験して、ビジネスの現場でもアイデア検証や業務自動化ツールの試作が圧倒的なスピードで実現できるだろうと感じました。

一方で、生成内容には誤情報や不正確さが含まれる可能性があるので、高度になったとはいえ万能ではないため、最終的な判断はあくまで人間が行い、利用目的に応じて適切な検証を挟むことが重要です。

株式会社Digeonは、法人向けに生成AI活用のファーストステップに最適なサービスである「ENSOUチャットボット」を提供しています。

ENSOUチャットボットでは、AIにデータが学習されるリスクなく、また情報漏洩に関しても厳重に管理され、安心して生成AIの活用を始められます。

ご相談、無料トライアルは、以下からお問い合わせください👇

サービス紹介資料をこちらからダウンロードいただけます👇

あわせて読む

こちらはGeminiに関連する記事になります。ぜひご覧ください。

NotebookLM 動画解説が日本語対応!使い方と活用事例を徹底解説

Google検索に「AIモード」登場!従来の検索との違いと使い方を徹底解説

NanoBananaとは何か?特徴・使い方・活用事例を徹底解説

フリープラン

今すぐ無料で始める

クレジットカード登録・申込不要。今すぐ始められます。

メールアドレスのみで今すぐ始められます!
無料で始める
お問い合わせ
無料でRAG構築ができる
無料で使えるプロンプトテンプレート多数
無料でGPT-5.1が使える

NEW

最新記事

【検証】GPT-5.2 vs Gemini 3 Pro:ビジネススライドをより綺麗に作れるのは?

ブログ

【検証】GPT-5.2 vs Gemini 3 Pro:ビジネススライドをより綺麗に作れるのは?

2025年12月12日にOpenAI社よりGemini3の対抗馬と思われるGPT - 5.2のリリースがされました。この記事では賢くなったGPTとGeminiの両者をスライド生成の観点から徹底比較します。

2025/12/13詳細を見る
GPT - 5.2がリリース 進化点と実際の使用感を徹底解説

ブログ

GPT - 5.2がリリース 進化点と実際の使用感を徹底解説

2025年12月12日にOpenAIよりGPTの新モデルであるGPT5.2がリリースされました。この記事ではGPT5.2が前モデルのGPT5.1から何が変わったのかについて徹底解説します。

2025/12/12詳細を見る
ENSOUを使った問い合わせ対応&ナレッジ自動生成エージェントの作成方法

ブログ

ENSOUを使った問い合わせ対応&ナレッジ自動生成エージェントの作成方法

ENSOUのカスタムチャットボット機能を使って、問い合わせ対応とナレッジの自動生成を行う問い合わせ対応エージェントの作成方法を画像やコード付きで徹底解説します。

2025/12/08詳細を見る
Copilot NotebooksとNotebookLMを徹底比較

ブログ

Copilot NotebooksとNotebookLMを徹底比較

Copilot Notebooksが消費者向けに登場! この記事ではCopilot Notebooksとは何なのか、またNotebookLMとの違いまで徹底比較します。

2025/12/13詳細を見る
NotebookLMでのスライド作成方法を徹底解説

ブログ

NotebookLMでのスライド作成方法を徹底解説

NotebookLMを用いてスライドを作成する方法を画像付きでわかりやすく解説します。

2025/12/04詳細を見る
ENSOUチャットボットとGoogleドライブを連携させてRAGを構築する方法を徹底解説

ブログ

ENSOUチャットボットとGoogleドライブを連携させてRAGを構築する方法を徹底解説

本記事ではGoogleドライブをENSOUと連携し、社内データを効率的に活用する方法を解説します。

2025/11/25詳細を見る