2025年11月19日

Gemini3が登場 - 推論とマルチモーダル能力が大幅進化

Googleより新たなLLM(大規模言語モデル)としてGemini3が発表されました。 旧モデルのGemini2.5との進化点からGPTとの比較まで徹底解説します。

松尾庄馬
松尾庄馬
取締役
カテゴリ:AIニュース
Gemini3が登場 - 推論とマルチモーダル能力が大幅進化

2025年11月18日、GoogleはGeminiシリーズの最新アップデートとして「Gemini3」を正式発表しました。従来モデルを総合的に上回る性能を備えた、大幅なアップグレードです。

この記事では、Gemini3の概要と提供状況、進化ポイント、そして実際に使ってみた所感までを丁寧に解説します。機能が増え過ぎて追いきれないという方も、ここだけ読めば要点を把握できます。

株式会社 Digeonは、APIを介してユーザーのデータがAIの学習に利用されることなく、セキュアに安心してご利用いただけるサービスである「ENSOUチャットボット」を提供しています。

無料ですぐに使えるフリープランのご利用開始はこちらから👇

他のモデルを凌駕するGemini3

Gemini 3 は最先端の推論能力を備え、従来バージョンと比較して、主要な AI ベンチマーク(性能評価指標)のほぼすべてで優れた結果を示しています。

Google によれば、博士号レベルの知能を持つモデルだと説明されています。

以下の画像では、各種ベンチマーク結果が表形式で示されています。太字になっている箇所が、その試験項目で最も高いパフォーマンスを記録したモデルです。

新たに発表された「Gemini 3 Pro」は、ほぼ全てのテスト項目において、他モデルと同等かそれ以上の性能を示しています。

Gemini3と主要モデルのベンチマーク比較表。ほぼ全ての項目でGemini3 Proが上位を占めている
出典元:https://blog.google/products/gemini/gemini-3/#gemini-3

優れた推論能力を発揮 - Gemini 3 Deep Think

Gemini 3 Deep Think は、Humanity’s Last Exam(人類最後の試験)などのベンチマークにおいて、その高い推論能力を生かし、これまでに例のないパフォーマンスを達成しました。

この「人類最後の試験」は、あらゆる分野の超難問を集めたテストで、人類の叡智を結集して設計されたと言われる非常に難度の高い試験です。この超高難度ベンチマークで他モデルに大きく差をつけていることからも、Gemini 3 の圧倒的な推論力がうかがえます。

Gemini3DeepThinkの他のモデルとの性能比較グラフ
引用元:https://blog.google/intl/ja-jp/company-news/technology/gemini-3/#learn-anything

LMArenaでも1位を獲得

ユーザーに対してモデル名を伏せた状態で複数の AI を使ってもらい、「どちらが良かったか」に投票してもらう形式で人気を競う評価プラットフォーム として「LMArena」というものがあります。こちらでも、Gemini 3 はライバルモデルを抑えて首位を獲得しました。

この結果から、単にベンチマークの数値が優れているだけでなく、実際にユーザーが使ってみたときの「体感的な賢さ」という観点でも高く評価されていることが分かります。

LMArenaでの比較表、首位をとるGemini 3 Pro
引用元:https://lmarena.ai/leaderboard

日本でのGemini 3の提供状況

Gemini 3 は、一般ユーザー向け・開発者向け・エンタープライズ向けに順次提供が開始されます。

Gemini 3 Pro は一部制限付きながら無料版でも利用可能です。有料版ユーザー(Pro、 Ultra)の方は、これまでと同じ感覚で、そのまま Gemini 3 Pro を利用できます。

圧倒的なマルチモーダル性能

Gemini シリーズは Gemini 2.5 の時点からマルチモーダル処理に強みがありました。マルチモーダルとは、異なる種類の情報を統合して処理する仕組みを指します。たとえば、カメラで撮影した映像とマイクで録音した音声のように、性質の異なる情報を一括で理解する能力のことです。

Gemini 3 ではこのマルチモーダル性能がさらに向上し、複数の情報源を組み合わせても、より自然でシームレスな応答が得られるようになりました。たとえば以下のような使い方ができます。

  • 手書きメモを撮影した写真から内容を自動で読み取り、テキストとして整理する
  • 論文・講義動画・講義資料を読み込ませると、学習用のフラッシュカードを自動生成する

これにより、テキスト入力が中心だった従来の生成 AI と比べて、より直感的で使いやすくなっています。

優れたゼロショット生成で単純なアプリを瞬時に生成

Gemini 3 はゼロショット生成能力が大幅に強化されており、適切なプロンプトを与えるだけで動画のデモンストレーションでも紹介されているような簡易 3D ゲームを動画レベルのクオリティで生成できます。

コードの下書きや構成案を用意しなくても、自然言語の指示だけでアプリの形がその場で立ち上がるため、開発の初速が劇的に高まります。

この記事の後半にある「ゼロショット生成で簡単なアプリを作ってみる」で、実際にユーザーが作れるのかを検証していきます。

実際の使用感

知りたい情報をアニメーション付きでわかりやすく学ぶ

動画のデモでは、Google 検索の AI モードが提供する生成 UI を使い、RNA ポリメラーゼの仕組みをアニメーション付きで理解できる様子が紹介されていました。

実際に同じ操作を試してみましたが、現時点ではこの機能はまだ利用できないようで、デモと同じ体験を再現することはできませんでした。デモで使用されていた画面表示と比べると表示が異なっていたため、アップデートがまだ配信されていない可能性が高そうです。正式な一般公開が待ち遠しいところです。

デモ通りに表示されない画面
2025年11月19日時点での筆者の検索画面

ゼロショット生成で簡単なアプリを作ってみる

次に、ゼロショット生成の実力を検証するために、以下のような非常にシンプルなプロンプトを投げてみました。

テトリスのような簡単なゲームを作ってください。

この一文だけで、即座にコード生成が開始されます。

ゲームのコードを生成中の画面

実際にできたゲームがこちらになります。

実際にプレイ可能で、ブロックの落下や操作も問題なく動作しました。

自然言語の一言だけで、コードを書く必要もなく、修正依頼すら不要でここまで動くゲームが生成されるのは非常に驚きです。

今回はゲームを題材にしましたが、業務の中で使う簡易的な自動化ツール作成程度であれば、同じ手法で短時間に構築できるでしょう。

直感的かつスピーディにプロトタイプを作れるという点で、コードや読めない人だけでなく開発者にも大きな利点があると感じました。

まとめ

Gemini 3 の完成度は非常に高く、多くの領域で他モデルを凌駕する結果となりました。

特に推論性能とマルチモーダル処理は着実に強化されています。画像・映像・音声・テキストをまたいで統合的に理解し、自然な応答を返せる点は他モデルと比較してもGeminiの方が良いと感じる場面がありました。発表会で示されていたアニメーション付きの説明機能こそ現時点では再現できませんでしたが、これが一般ユーザーでも利用できるようになれば、単なるAIのツールとして使うだけでなく、勉強内容を気軽に聞ける相棒となるでしょう。

また、ゼロショット生成による簡易アプリの自動構築には特に感動しました。エラーなく一発で動くものが一言でできるということを実際に体験して、ビジネスの現場でもアイデア検証や業務自動化ツールの試作が圧倒的なスピードで実現できるだろうと感じました。

一方で、生成内容には誤情報や不正確さが含まれる可能性があるので、高度になったとはいえ万能ではないため、最終的な判断はあくまで人間が行い、利用目的に応じて適切な検証を挟むことが重要です。

株式会社Digeonは、法人向けに生成AI活用のファーストステップに最適なサービスである「ENSOUチャットボット」を提供しています。

ENSOUチャットボットでは、AIにデータが学習されるリスクなく、また情報漏洩に関しても厳重に管理され、安心して生成AIの活用を始められます。

ご相談、無料トライアルは、以下からお問い合わせください👇

サービス紹介資料をこちらからダウンロードいただけます👇

あわせて読む

こちらはGeminiに関連する記事になります。ぜひご覧ください。

NotebookLM 動画解説が日本語対応!使い方と活用事例を徹底解説

Google検索に「AIモード」登場!従来の検索との違いと使い方を徹底解説

NanoBananaとは何か?特徴・使い方・活用事例を徹底解説

Excelを渡すだけでAIアプリになる

今、Excelやノーコードで管理している業務をAIエージェントで自動化します。

NEW

最新記事

Excel業務を自動化するには?転記などの定型業務を効率化する方法

ブログ

Excel業務を自動化するには?転記などの定型業務を効率化する方法

Excel業務を自動化する方法として一般的に数式を使いこなすことやマクロを使うことなどが挙げられます。この記事では一般的な自動化方法とAIを活用した自動化方法、転記、レポート作成を効率化する方法を解説します。

2026/05/08詳細を見る
業務向けノーコードツール15選|用途別の選び方と導入のポイント

ブログ

業務向けノーコードツール15選|用途別の選び方と導入のポイント

業務アプリ、フォーム、Webサイト、データベース管理に使えるノーコードツール15選を用途別に解説。選び方、導入時の注意点、AIエージェントツールとの違いまでわかりやすく紹介します。

2026/04/30詳細を見る
GPT-5.5登場 - 概要から検証まで徹底解説!

ブログ

GPT-5.5登場 - 概要から検証まで徹底解説!

OpenAIが発表したGPT-5.5について、特徴や何が進化したのか、実際の使用感まで実務目線で解説します。

2026/04/24詳細を見る
RAGとAIエージェントの違いとは?できることと違いをわかりやすく解説

ブログ

RAGとAIエージェントの違いとは?できることと違いをわかりやすく解説

RAGとAIエージェントは、どちらも生成AIの活用でよく出てくる言葉ですが、できることは同じではありません。この記事では、RAGの基本、AIエージェントとの違い、RAGだけでできること・難しいことを整理しながら業務でどう使い分けるべきかをわかりやすく解説します。

2026/05/08詳細を見る
SharePoint・Googleドライブと連携して社内問い合わせ対応を自動化する方法|情シス・人事・総務の負担を減らすAI活用を解説

ブログ

SharePoint・Googleドライブと連携して社内問い合わせ対応を自動化する方法|情シス・人事・総務の負担を減らすAI活用を解説

社内問い合わせ対応の自動化は、情シス・人事・総務の負担を減らすだけでなく、属人化の抑制や新人の自己解決の促進にもつながります。この記事では、社内問い合わせ対応を自動化する方法、RAGの活用場面、導入時の注意点、ENSOU AIを活用した進め方について解説します。

2026/04/21詳細を見る
Claude Designがリリース - 詳細から実際の使い方まで徹底解説!

ブログ

Claude Designがリリース - 詳細から実際の使い方まで徹底解説!

2026年4月18日にAnthropic社よりClaudeにデザインやスライドを自由に作成しその場で編集できる機能としてClaudeDesignをリリースしたと発表がありました。

2026/04/21詳細を見る