ESC
キーワードを入力してください
提供中 multimodal フラッグシップ 推論対応 v2.5-pro

Gemini 2.5 Pro

Google DeepMind
video-text-to-text
2025/3/25
Gemini 2.5

Googleの最もインテリジェントなAIモデル(2025年前半時点)。思考モデルとして推論ステップを踏んでから応答。

対応機能

1Mトークン コンテキスト 思考モデル(Thinking Model) マルチモーダル入出力 コーディング

スペック

コンテキストウィンドウ 1.0M トークン
最大出力トークン 64K トークン
入力モダリティ
テキスト 画像 音声 動画 ファイル
出力モダリティ
テキスト

オープンソース情報

重みの公開
非公開
ライセンス
proprietary
学習データの開示
非開示

学術・技術メタ

アーキテクチャ Transformer (Multimodal)

外部リンク

関連知識項目