Percorso 1: input_audio in forma OpenAI su /v1/chat/completions
Il gateway traduce automaticamente la parte di contenuto OpenAI input_audio
in inline_data di Gemini. Il campo format mappa al tipo MIME
appropriato (mp3 → audio/mp3, wav → audio/wav, ecc.).
Percorso 2: /v1beta/ nativo con inline_data
Se sei già sul protocollo nativo di Gemini, passa inline_data
direttamente — nessuna traduzione coinvolta.
Famiglie di modelli supportate
I modelli Gemini multimodali accettano audio inline — ad esempiogoogle/gemini-2.5-flash e la linea Gemini 3.x. Il comportamento corrisponde
esattamente alla Gemini API pubblicata da Google.
