ESC
キーワードを入力してください
Compare · Models

AI モデルを、 一つの尺度で並べる。

性能・価格・コンテキスト長・マルチモーダル対応を一覧。最大4モデルを選んで詳細比較できます。

44
Models
7
Providers
2026/03
Updated
0 モデルが比較対象に選択されています(最大 4
Catalog

44 モデル一覧

気になるモデルの「+」を押して、下の詳細比較で並べる(最大4つまで)

0Selected/ Max 4
Model+
Gemma 4 E2B
Google DeepMind · apache-2-0
Gemma 4 E4B
Google DeepMind · apache-2-0
Gemma 4 26B A4B
Google DeepMind · apache-2-0
Gemma 4 31B
Google DeepMind · apache-2-0
Claude Sonnet 4.6
Anthropic · proprietary
Qwen3.5-397B-A17B
Alibaba Cloud (Qwen Team) · apache-2-0
GPT-5.3 Codex
OpenAI · proprietary
Claude Opus 4.6
Anthropic · proprietary
Gemini 3 Flash
Google DeepMind · proprietary
GPT-5.2
OpenAI · proprietary
Mistral Large 3
Mistral AI · apache-2-0
Claude Opus 4.5
Anthropic · proprietary
Gemini 3 Deep Think
Google DeepMind · proprietary
Gemini 3 Pro
Google DeepMind · proprietary
GPT-5.1
OpenAI · proprietary
Claude Haiku 4.5
Anthropic · proprietary
DeepSeek-V3.2-Exp
DeepSeek · mit
Claude Sonnet 4.5
Anthropic · proprietary
GPT-5
OpenAI · proprietary
Gemini 2.5 Flash
Google DeepMind · proprietary
Mistral Medium 3
Mistral AI · proprietary
Qwen3-30B-A3B
Alibaba Cloud (Qwen Team) · apache-2-0
Qwen3-235B-A22B
Alibaba Cloud (Qwen Team) · apache-2-0
Llama 4 Maverick
Meta AI · llama-community
Llama 4 Scout
Meta AI · llama-community
Gemini 2.5 Pro
Google DeepMind · proprietary
o3-mini
Unknown · proprietary
DeepSeek-R1
DeepSeek · mit
Codestral
Unknown · proprietary
DeepSeek-V3
Unknown · proprietary
o1
Unknown · proprietary
Gemini 2.0 Flash
Unknown · proprietary
Mistral Large
Unknown · proprietary
Claude 3.5 Haiku
Unknown · proprietary
Llama 3.2 90B
Unknown · proprietary
o1-mini
Unknown · proprietary
Grok-2
Unknown · proprietary
Llama 3.1 405B
Unknown · proprietary
Claude 3.5 Sonnet
Anthropic · proprietary
Gemini 1.5 Flash
Unknown · proprietary
GPT-4o
Unknown · proprietary
GPT-4 Turbo
Unknown · proprietary
Claude 3 Opus
Unknown · proprietary
Gemini 1.5 Pro
Google DeepMind · proprietary
Side by Side

選んだモデルを並べる

最大 4 モデル。一覧で「+」を押すか、空きスロットから追加。

+モデルを追加
+モデルを追加
+モデルを追加
+モデルを追加
OVERALL
yuuQ Score
PERFORMANCE
MMLU
HumanEval
JA-MT
CAPACITY
Context
Speed
PRICING
Input
Output
MULTIMODAL
Vision
Audio
Video
PARETO FRONTIER

コスパで俯瞰する

散布図に描くデータがありません。

Recommendations

用途別、編集部の選定

性能・価格・運用安定性のバランスから、用途ごとに上位を選定。

USE CASE 01

コード生成・補完

HumanEval / SWE-bench を重視。実装パターンを安定して引ける推論力。

対応モデルは登録待ち

USE CASE 02

RAG・社内ドキュメント検索

コンテキスト長と日本語の正確さが鍵。長文要約 / 引用整合の品質。

  1. 01 Qwen3.5-397B-A17B Alibaba Cloud (Qwen Team)
  2. 02 DeepSeek-V3.2-Exp DeepSeek
  3. 03 Mistral Medium 3 Mistral AI
USE CASE 03

エージェント・ツール呼び出し

function-calling / tool 連携の安定性、推論モードの制御性。

対応モデルは登録待ち

From the Editor

ベンチマーク値だけでは決まらない、選定の現場知。

ベンチマーク差は数ポイント単位でも、現場では「日本語の語感」「ツール呼び出しの安定性」「推論コストとレイテンシの折り合い」が決定打になります。 まずは 主要ベンチで上位を絞り、用途別レコメンドと自社のRAG/エージェント要件で再評価するのが最短ルート。

更新: 2026/03 · 編集部 モデル選定の解説記事へ →

関連リンク