路径 1:/v1/chat/completions 上的 OpenAI 形态 input_audio
网关会自动把 OpenAI 的 input_audio 内容片段翻译为 Gemini 的
inline_data。format 字段会映射到正确的 MIME 类型(mp3 →
audio/mp3、wav → audio/wav 等等)。
路径 2:原生 /v1beta/ + inline_data
如果你已经在用 Gemini 原生协议,直接传 inline_data——无需任何
翻译。
支持的模型家族
Gemini 多模态模型支持内联音频——例如google/gemini-2.5-flash 及
Gemini 3.x 系列。行为完全与 Google 公布的 Gemini API 一致。
