Chemin 1 : input_audio de forme OpenAI sur /v1/chat/completions
La passerelle traduit automatiquement la partie de contenu
input_audio OpenAI vers inline_data Gemini. Le champ format
mappe au bon type MIME (mp3 → audio/mp3, wav → audio/wav,
etc.).
Chemin 2 : /v1beta/ natif avec inline_data
Si vous êtes déjà sur le protocole natif Gemini, passez inline_data
directement — aucune traduction impliquée.
Familles de modèles prises en charge
Les modèles multimodaux Gemini acceptent l’audio en ligne — par exemplegoogle/gemini-2.5-flash et la ligne Gemini 3.x. Le
comportement correspond exactement à l’API Gemini publiée de Google.
