2025年11月19日

Gemini3が登場 - 推論とマルチモーダル能力が大幅進化

Googleより新たなLLM(大規模言語モデル)としてGemini3が発表されました。 旧モデルのGemini2.5との進化点からGPTとの比較まで徹底解説します。

松尾庄馬
松尾庄馬
取締役
Gemini3が登場 - 推論とマルチモーダル能力が大幅進化

2025年11月18日、GoogleはGeminiシリーズの最新アップデートとして「Gemini3」を正式発表しました。従来モデルを総合的に上回る性能を備えた、大幅なアップグレードです。

この記事では、Gemini3の概要と提供状況、進化ポイント、そして実際に使ってみた所感までを丁寧に解説します。機能が増え過ぎて追いきれないという方も、ここだけ読めば要点を把握できます。

株式会社 Digeonは、APIを介してユーザーのデータがAIの学習に利用されることなく、セキュアに安心してご利用いただけるサービスである「ENSOUチャットボット」を提供しています。

無料ですぐに使えるフリープランのご利用開始はこちらから👇

他のモデルを凌駕するGemini3

Gemini 3 は最先端の推論能力を備え、従来バージョンと比較して、主要な AI ベンチマーク(性能評価指標)のほぼすべてで優れた結果を示しています。

Google によれば、博士号レベルの知能を持つモデルだと説明されています。

以下の画像では、各種ベンチマーク結果が表形式で示されています。太字になっている箇所が、その試験項目で最も高いパフォーマンスを記録したモデルです。

新たに発表された「Gemini 3 Pro」は、ほぼ全てのテスト項目において、他モデルと同等かそれ以上の性能を示しています。

Gemini3と主要モデルのベンチマーク比較表。ほぼ全ての項目でGemini3 Proが上位を占めている
出典元:https://blog.google/products/gemini/gemini-3/#gemini-3

優れた推論能力を発揮 - Gemini 3 Deep Think

Gemini 3 Deep Think は、Humanity’s Last Exam(人類最後の試験)などのベンチマークにおいて、その高い推論能力を生かし、これまでに例のないパフォーマンスを達成しました。

この「人類最後の試験」は、あらゆる分野の超難問を集めたテストで、人類の叡智を結集して設計されたと言われる非常に難度の高い試験です。この超高難度ベンチマークで他モデルに大きく差をつけていることからも、Gemini 3 の圧倒的な推論力がうかがえます。

Gemini3DeepThinkの他のモデルとの性能比較グラフ
引用元:https://blog.google/intl/ja-jp/company-news/technology/gemini-3/#learn-anything

LMArenaでも1位を獲得

ユーザーに対してモデル名を伏せた状態で複数の AI を使ってもらい、「どちらが良かったか」に投票してもらう形式で人気を競う評価プラットフォーム として「LMArena」というものがあります。こちらでも、Gemini 3 はライバルモデルを抑えて首位を獲得しました。

この結果から、単にベンチマークの数値が優れているだけでなく、実際にユーザーが使ってみたときの「体感的な賢さ」という観点でも高く評価されていることが分かります。

LMArenaでの比較表、首位をとるGemini 3 Pro
引用元:https://lmarena.ai/leaderboard

日本でのGemini 3の提供状況

Gemini 3 は、一般ユーザー向け・開発者向け・エンタープライズ向けに順次提供が開始されます。

Gemini 3 Pro は一部制限付きながら無料版でも利用可能です。有料版ユーザー(Pro、 Ultra)の方は、これまでと同じ感覚で、そのまま Gemini 3 Pro を利用できます。

圧倒的なマルチモーダル性能

Gemini シリーズは Gemini 2.5 の時点からマルチモーダル処理に強みがありました。マルチモーダルとは、異なる種類の情報を統合して処理する仕組みを指します。たとえば、カメラで撮影した映像とマイクで録音した音声のように、性質の異なる情報を一括で理解する能力のことです。

Gemini 3 ではこのマルチモーダル性能がさらに向上し、複数の情報源を組み合わせても、より自然でシームレスな応答が得られるようになりました。たとえば以下のような使い方ができます。

  • 手書きメモを撮影した写真から内容を自動で読み取り、テキストとして整理する
  • 論文・講義動画・講義資料を読み込ませると、学習用のフラッシュカードを自動生成する

これにより、テキスト入力が中心だった従来の生成 AI と比べて、より直感的で使いやすくなっています。

優れたゼロショット生成で単純なアプリを瞬時に生成

Gemini 3 はゼロショット生成能力が大幅に強化されており、適切なプロンプトを与えるだけで動画のデモンストレーションでも紹介されているような簡易 3D ゲームを動画レベルのクオリティで生成できます。

コードの下書きや構成案を用意しなくても、自然言語の指示だけでアプリの形がその場で立ち上がるため、開発の初速が劇的に高まります。

この記事の後半にある「ゼロショット生成で簡単なアプリを作ってみる」で、実際にユーザーが作れるのかを検証していきます。

実際の使用感

知りたい情報をアニメーション付きでわかりやすく学ぶ

動画のデモでは、Google 検索の AI モードが提供する生成 UI を使い、RNA ポリメラーゼの仕組みをアニメーション付きで理解できる様子が紹介されていました。

実際に同じ操作を試してみましたが、現時点ではこの機能はまだ利用できないようで、デモと同じ体験を再現することはできませんでした。デモで使用されていた画面表示と比べると表示が異なっていたため、アップデートがまだ配信されていない可能性が高そうです。正式な一般公開が待ち遠しいところです。

デモ通りに表示されない画面
2025年11月19日時点での筆者の検索画面

ゼロショット生成で簡単なアプリを作ってみる

次に、ゼロショット生成の実力を検証するために、以下のような非常にシンプルなプロンプトを投げてみました。

テトリスのような簡単なゲームを作ってください。

この一文だけで、即座にコード生成が開始されます。

ゲームのコードを生成中の画面

実際にできたゲームがこちらになります。

実際にプレイ可能で、ブロックの落下や操作も問題なく動作しました。

自然言語の一言だけで、コードを書く必要もなく、修正依頼すら不要でここまで動くゲームが生成されるのは非常驚きです。

今回はゲームを題材にしましたが、業務の中で使う簡易的な自動化ツール作成程度であれば、同じ手法で短時間に構築できるでしょう。

直感的かつスピーディにプロトタイプを作れるという点で、コードや読めない人だけでなく開発者にも大きな利点があると感じました。

まとめ

Gemini 3 の完成度は非常に高く、多くの領域で他モデルを凌駕する結果となりました。

特に推論性能とマルチモーダル処理は着実に強化されています。画像・映像・音声・テキストをまたいで統合的に理解し、自然な応答を返せる点は他モデルと比較してもGeminiの方が良いと感じる場面がありました。発表会で示されていたアニメーション付きの説明機能こそ現時点では再現できませんでしたが、これが一般ユーザーでも利用できるようになれば、単なるAIのツールとして使うだけでなく、勉強内容を気軽に聞ける相棒となるでしょう。

また、ゼロショット生成による簡易アプリの自動構築には特に感動しました。エラーなく一発で動くものが一言でできるということを実際に体験して、ビジネスの現場でもアイデア検証や業務自動化ツールの試作が圧倒的なスピードで実現できるだろうと感じました。

一方で、生成内容には誤情報や不正確さが含まれる可能性があるので、高度になったとはいえ万能ではないため、最終的な判断はあくまで人間が行い、利用目的に応じて適切な検証を挟むことが重要です。

株式会社Digeonは、法人向けに生成AI活用のファーストステップに最適なサービスである「ENSOUチャットボット」を提供しています。

ENSOUチャットボットでは、AIにデータが学習されるリスクなく、また情報漏洩に関しても厳重に管理され、安心して生成AIの活用を始められます。

ご相談、無料トライアルは、以下からお問い合わせください👇

https://ensou.app/contact/


サービス紹介資料をこちらからダウンロードいただけます👇

https://ensou.app/downloads/chatbot_overview/

あわせて読む

こちらはGeminiに関連する記事になります。ぜひご覧ください。

NotebookLM 動画解説が日本語対応!使い方と活用事例を徹底解説

Google検索に「AIモード」登場!従来の検索との違いと使い方を徹底解説

NanoBananaとは何か?特徴・使い方・活用事例を徹底解説

フリープラン

今すぐ無料で始める

クレジットカード登録・申込不要。今すぐ始められます。

NEW

最新記事

Gemini3が登場 - 推論とマルチモーダル能力が大幅進化

ブログ

Gemini3が登場 - 推論とマルチモーダル能力が大幅進化

Googleより新たなLLM(大規模言語モデル)としてGemini3が発表されました。 旧モデルのGemini2.5との進化点からGPTとの比較まで徹底解説します。

2025/11/19詳細を見る
Microsoft 365 Copilotを使ってRAGを構築する方法をわかりやすく解説

ブログ

Microsoft 365 Copilotを使ってRAGを構築する方法をわかりやすく解説

本記事ではCopilotで社内データを連携し、RAGを構築する方法を画像付きで解説します。

2025/11/18詳細を見る
GPT-5.1 API reasoning_effort / verbosity の使い方を完全解説

ブログ

GPT-5.1 API reasoning_effort / verbosity の使い方を完全解説

GPT-5.1 を OpenAI API から実際に呼び出し、GPT-5 との違いや reasoning_effort・verbosity の挙動を検証します。

2025/11/17詳細を見る
ChatGPTとGoogleドライブを連携して社内データを活用する方法を解説!!

ブログ

ChatGPTとGoogleドライブを連携して社内データを活用する方法を解説!!

本記事ではGoogleドライブをChatGPTと連携し、社内データを効率的に活用する方法を解説します。またその際のメリット、問題点についても説明します。

2025/11/19詳細を見る
GPT5.1がリリース - より賢く、より話しやすいAIに。アップデート内容を徹底解説。

ブログ

GPT5.1がリリース - より賢く、より話しやすいAIに。アップデート内容を徹底解説。

OpenAIからGPT-5のアップグレードモデルとしてGPT-5.1がリリースされました。この新モデルは従来のものと何が違うのか、その提供状況まで踏まえて詳しく解説します。

2025/11/17詳細を見る
ENSOUチャットボットを安全にご利用頂くためのセキュリティ

ブログ

ENSOUチャットボットを安全にご利用頂くためのセキュリティ

企業の生成AI活用を安全に。ENSOUチャットボットは、AWS認定・ISMAP登録クラウド基盤、多層防御、学習不使用APIで機密データを保護。上場企業・官公庁実績、統合管理でシャドーAIを解消。エンタープライズ対応やSSO連携も可能。無料プランあり。

2025/11/14詳細を見る