Camino 1: input_audio en forma OpenAI en /v1/chat/completions
La pasarela traduce automáticamente la parte de contenido
input_audio de OpenAI al inline_data de Gemini. El campo
format mapea al tipo MIME correcto (mp3 → audio/mp3, wav →
audio/wav, etc.).
Camino 2: /v1beta/ nativo con inline_data
Si ya estás en el protocolo nativo de Gemini, pasa inline_data
directamente — sin traducción involucrada.
Familias de modelos soportadas
Los modelos multimodales Gemini aceptan audio inline — por ejemplogoogle/gemini-2.5-flash y la línea Gemini 3.x. El comportamiento
coincide exactamente con la API Gemini publicada por Google.
