Đường 1: input_audio định dạng OpenAI trên /v1/chat/completions
Gateway tự động dịch content part input_audio của OpenAI sang
inline_data của Gemini. Trường format được ánh xạ đến loại MIME
đúng (mp3 → audio/mp3, wav → audio/wav, v.v.).
Đường 2: /v1beta/ bản địa với inline_data
Nếu bạn đã đang dùng giao thức bản địa của Gemini, truyền trực tiếp
inline_data — không có lớp dịch nào.
Các họ mô hình được hỗ trợ
Các mô hình đa phương thức Gemini chấp nhận âm thanh nội tuyến — ví dụgoogle/gemini-2.5-flash và dòng Gemini 3.x. Hành vi khớp chính xác
với API Gemini do Google công bố.
