Путь 1: input_audio в формате OpenAI на /v1/chat/completions
Шлюз автоматически транслирует часть контента OpenAI input_audio в
Gemini inline_data. Поле format сопоставляется с правильным
MIME-типом (mp3 → audio/mp3, wav → audio/wav и т. д.).
Путь 2: нативный /v1beta/ с inline_data
Если вы уже на нативном протоколе Gemini, передавайте inline_data
напрямую — никакой трансляции.
Поддерживаемые семейства моделей
Мультимодальные модели Gemini принимают inline-аудио — например,google/gemini-2.5-flash и линейка Gemini 3.x. Поведение в точности
соответствует опубликованному Gemini API от Google.
