ESC
キーワードを入力してください

マルチモーダル

llm
表示形式

テキスト、画像、音声、動画など複数の形式(モダリティ)のデータを統合的に処理できるAIの能力。

GPT-4V、Gemini、Claude 3、Llama 4などが対応。