Compare · Models

AI モデルを、
一つの尺度で並べる。

性能・価格・コンテキスト長・マルチモーダル対応を一覧。最大4モデルを選んで詳細比較できます。

Models

Providers

2026/03

Updated

Catalog

44 モデル一覧

気になるモデルの「+」を押して、下の詳細比較で並べる（最大4つまで）

0Selected/ Max 4

#	Model	Category
1	Gemma 4 E2B Google DeepMind · apache-2-0	OPEN	—	—	—	—	— / —	128K
2	Gemma 4 E4B Google DeepMind · apache-2-0	OPEN	—	—	—	—	— / —	128K
3	Gemma 4 26B A4B Google DeepMind · apache-2-0	OPEN	—	—	—	—	— / —	256K
4	Gemma 4 31B Google DeepMind · apache-2-0	OPEN	—	—	—	—	— / —	256K
5	Claude Sonnet 4.6 Anthropic · proprietary	GENERAL	—	—	—	—	$3.00 / $15.00	1.0M
6	Qwen3.5-397B-A17B Alibaba Cloud (Qwen Team) · apache-2-0	OPEN	—	—	—	—	— / —	—
7	GPT-5.3 Codex OpenAI · proprietary	GENERAL	—	—	—	—	— / —	400K
8	Claude Opus 4.6 Anthropic · proprietary	GENERAL	—	—	—	—	$5.00 / $25.00	1.0M
9	Gemini 3 Flash Google DeepMind · proprietary	GENERAL	—	—	—	—	$0.50 / $3.00	1.0M
10	GPT-5.2 OpenAI · proprietary	GENERAL	—	—	—	—	$1.75 / $14.00	400K
11	Mistral Large 3 Mistral AI · apache-2-0	OPEN	—	—	—	—	$0.50 / $1.50	256K
12	Claude Opus 4.5 Anthropic · proprietary	GENERAL	—	—	—	—	$5.00 / $25.00	200K
13	Gemini 3 Deep Think Google DeepMind · proprietary	GENERAL	—	—	—	—	— / —	1.0M
14	Gemini 3 Pro Google DeepMind · proprietary	GENERAL	—	—	—	—	$2.00 / $12.00	1.0M
15	GPT-5.1 OpenAI · proprietary	GENERAL	—	—	—	—	— / —	400K
16	Claude Haiku 4.5 Anthropic · proprietary	GENERAL	—	—	—	—	$1.00 / $5.00	200K
17	DeepSeek-V3.2-Exp DeepSeek · mit	OPEN	—	—	—	—	$0.28 / $0.42	128K
18	Claude Sonnet 4.5 Anthropic · proprietary	GENERAL	—	—	—	—	$3.00 / $15.00	1.0M
19	GPT-5 OpenAI · proprietary	GENERAL	—	—	—	—	$1.25 / $10.00	400K
20	Gemini 2.5 Flash Google DeepMind · proprietary	GENERAL	—	—	—	—	— / —	1.0M
21	Mistral Medium 3 Mistral AI · proprietary	GENERAL	—	—	—	—	$0.40 / $2.00	131K
22	Qwen3-30B-A3B Alibaba Cloud (Qwen Team) · apache-2-0	OPEN	—	—	—	—	— / —	—
23	Qwen3-235B-A22B Alibaba Cloud (Qwen Team) · apache-2-0	OPEN	—	—	—	—	— / —	1.0M
24	Llama 4 Maverick Meta AI · llama-community	OPEN	—	—	—	—	— / —	1.0M
25	Llama 4 Scout Meta AI · llama-community	OPEN	—	—	—	—	— / —	10.0M
26	Gemini 2.5 Pro Google DeepMind · proprietary	GENERAL	—	—	—	—	— / —	1.0M
27	o3-mini Unknown · proprietary	GENERAL	—	—	—	—	— / —	200K
28	DeepSeek-R1 DeepSeek · mit	OPEN	—	—	—	—	— / —	128K
29	Codestral Unknown · proprietary	GENERAL	—	—	—	—	— / —	256K
30	DeepSeek-V3 Unknown · proprietary	GENERAL	—	—	—	—	— / —	128K
31	o1 Unknown · proprietary	GENERAL	—	—	—	—	— / —	200K
32	Gemini 2.0 Flash Unknown · proprietary	GENERAL	—	—	—	—	— / —	1.0M
33	Mistral Large Unknown · proprietary	GENERAL	—	—	—	—	— / —	128K
34	Claude 3.5 Haiku Unknown · proprietary	GENERAL	—	—	—	—	— / —	200K
35	Llama 3.2 90B Unknown · proprietary	GENERAL	—	—	—	—	— / —	128K
36	o1-mini Unknown · proprietary	GENERAL	—	—	—	—	— / —	128K
37	Grok-2 Unknown · proprietary	GENERAL	—	—	—	—	— / —	131K
38	Llama 3.1 405B Unknown · proprietary	GENERAL	—	—	—	—	— / —	128K
39	Claude 3.5 Sonnet Anthropic · proprietary	GENERAL	—	—	—	—	— / —	200K
40	Gemini 1.5 Flash Unknown · proprietary	GENERAL	—	—	—	—	— / —	1.0M
41	GPT-4o Unknown · proprietary	GENERAL	—	—	—	—	— / —	128K
42	GPT-4 Turbo Unknown · proprietary	GENERAL	—	—	—	—	— / —	128K
43	Claude 3 Opus Unknown · proprietary	GENERAL	—	—	—	—	— / —	200K
44	Gemini 1.5 Pro Google DeepMind · proprietary	GENERAL	—	—	—	—	— / —	2.0M

Side by Side

選んだモデルを並べる

最大 4 モデル。一覧で「+」を押すか、空きスロットから追加。

+モデルを追加

OVERALL

yuuQ Score

—

PERFORMANCE

MMLU

—

HumanEval

—

JA-MT

—

CAPACITY

Context

—

Speed

—

PRICING

Input

—

Output

—

MULTIMODAL

Vision

—

Audio

—

Video

—

PARETO FRONTIER

コスパで俯瞰する

散布図に描くデータがありません。

Recommendations

用途別、編集部の選定

性能・価格・運用安定性のバランスから、用途ごとに上位を選定。

USE CASE 01

コード生成・補完

HumanEval / SWE-bench を重視。実装パターンを安定して引ける推論力。

対応モデルは登録待ち

USE CASE 02

RAG・社内ドキュメント検索

コンテキスト長と日本語の正確さが鍵。長文要約 / 引用整合の品質。

01 Qwen3.5-397B-A17B Alibaba Cloud (Qwen Team)
02 DeepSeek-V3.2-Exp DeepSeek
03 Mistral Medium 3 Mistral AI

USE CASE 03

エージェント・ツール呼び出し

function-calling / tool 連携の安定性、推論モードの制御性。

対応モデルは登録待ち

From the Editor

ベンチマーク値だけでは決まらない、選定の現場知。

ベンチマーク差は数ポイント単位でも、現場では「日本語の語感」「ツール呼び出しの安定性」「推論コストとレイテンシの折り合い」が決定打になります。まずは主要ベンチで上位を絞り、用途別レコメンドと自社のRAG/エージェント要件で再評価するのが最短ルート。

更新: 2026/03 · 編集部モデル選定の解説記事へ →

次に進む

目的に合わせて、学ぶ・比較する・相談するの3つの導線から選べます。

学ぶ

記事・解説・ニュースから学習する

比較する

モデル・ツール・タイムラインを比較して判断する

相談する

導入・活用の相談をフォームで送る