경로 1: /v1/chat/completions의 OpenAI 형태 input_audio
게이트웨이가 OpenAI input_audio 컨텐츠 파트를 Gemini의
inline_data로 자동 변환합니다. format 필드는 올바른 MIME
타입에 매핑됩니다(mp3 → audio/mp3, wav → audio/wav 등).
경로 2: 네이티브 /v1beta/와 inline_data
이미 Gemini의 네이티브 프로토콜을 사용 중이라면 변환 없이
inline_data를 직접 전달하세요.
지원 모델 패밀리
Gemini 멀티모달 모델 — 예를 들어google/gemini-2.5-flash와
Gemini 3.x 라인 — 가 인라인 오디오를 받습니다. 동작은 Google이
공개한 Gemini API와 정확히 일치합니다.
