Chuyển đến nội dung chính
OrcaRouter thêm một số ít header vào mọi phản hồi API để bạn có thể kiểm tra cách yêu cầu được định tuyến. Chúng cho biết mô hình nào đã phục vụ lệnh gọi (theo cùng định dạng có tiền tố nhà cung cấp mà bạn truyền vào model); chúng không tiết lộ chi tiết định tuyến nội bộ như định danh kênh hoặc URL backend upstream.
HeaderCó khiVí dụÝ nghĩa
X-Orca-Fallback-Levelextra_body.models gây dự phòng1Vị trí bắt đầu từ 0 trong chuỗi dự phòng đã phục vụ phản hồi. 0 nghĩa là mô hình chính thành công và dự phòng không kích hoạt.
X-Orca-Fallback-ModelDự phòng kích hoạt (level > 0)google/gemini-2.5-proMô hình thực sự phục vụ phản hồi sau khi mô hình chính thất bại.
X-Orca-RouterBạn gọi orcarouter/{name}autoTên của router bạn đã gọi.
X-Orca-Resolved-ModelBạn gọi orcarouter/{name}openai/gpt-4o-miniMô hình cụ thể mà router đã giải tại thời điểm yêu cầu.
Retry-AfterPhản hồi là 429 Too Many Requests5Số giây cần chờ trước khi thử lại.

Đọc chúng trong mã

response = client.chat.completions.with_raw_response.create(
    model="orcarouter/auto",
    messages=[...],
)
print(response.headers.get("X-Orca-Resolved-Model"))

Những gì OrcaRouter không đưa ra

Chúng tôi cố tình không thêm:
  • Một header hoặc trường phản hồi provider hay routed_to
  • Bất kỳ định danh định tuyến nội bộ hoặc URL backend upstream nào
  • Bất kỳ header nào cho người gọi biết upstream nào đã phục vụ yêu cầu
OrcaRouter là một nhà cung cấp duy nhất theo góc nhìn của ứng dụng bạn. Định tuyến nội bộ là việc của chúng tôi, không phải phụ thuộc của bạn.