提供中 multimodal フラッグシップ推論対応 v2.5-pro

Gemini 2.5 Pro

video-text-to-text

2025/3/25

Gemini 2.5

Googleの最もインテリジェントなAIモデル（2025年前半時点）。思考モデルとして推論ステップを踏んでから応答。

対応機能

1Mトークンコンテキスト思考モデル（Thinking Model）マルチモーダル入出力コーディング

コンテキストウィンドウ 1.0M トークン

最大出力トークン 64K トークン

入力モダリティ

テキスト画像音声動画ファイル

出力モダリティ

テキスト

アーキテクチャ Transformer (Multimodal)