Caminho 1: input_audio no formato OpenAI em /v1/chat/completions
O gateway traduz a parte de conteúdo input_audio da OpenAI para o
inline_data do Gemini automaticamente. O campo format mapeia para
o tipo MIME correto (mp3 → audio/mp3, wav → audio/wav, etc.).
Caminho 2: /v1beta/ nativo com inline_data
Se você já está no protocolo nativo do Gemini, passe inline_data
diretamente — nenhuma tradução envolvida.
Famílias de modelos suportadas
Modelos Gemini multimodais aceitam áudio inline — por exemplogoogle/gemini-2.5-flash e a linha Gemini 3.x. O comportamento
corresponde exatamente à API Gemini publicada pelo Google.
