Header phản hồi - OrcaRouter

OrcaRouter thêm một số ít header vào mọi phản hồi API để bạn có thể kiểm tra cách yêu cầu được định tuyến. Chúng cho biết mô hình nào đã phục vụ lệnh gọi (theo cùng định dạng có tiền tố nhà cung cấp mà bạn truyền vào model); chúng không tiết lộ chi tiết định tuyến nội bộ như định danh kênh hoặc URL backend upstream.

Header	Có khi	Ví dụ	Ý nghĩa
`X-Orca-Fallback-Level`	`extra_body.models` gây dự phòng	`1`	Vị trí bắt đầu từ 0 trong chuỗi dự phòng đã phục vụ phản hồi. `0` nghĩa là mô hình chính thành công và dự phòng không kích hoạt.
`X-Orca-Fallback-Model`	Dự phòng kích hoạt (level > 0)	`google/gemini-2.5-pro`	Mô hình thực sự phục vụ phản hồi sau khi mô hình chính thất bại.
`X-Orca-Router`	Bạn gọi `orcarouter/{name}`	`auto`	Tên của router bạn đã gọi.
`X-Orca-Resolved-Model`	Bạn gọi `orcarouter/{name}`	`openai/gpt-4o-mini`	Mô hình cụ thể mà router đã giải tại thời điểm yêu cầu.
`Retry-After`	Phản hồi là `429 Too Many Requests`	`5`	Số giây cần chờ trước khi thử lại.

Đọc chúng trong mã

response = client.chat.completions.with_raw_response.create(
    model="orcarouter/auto",
    messages=[...],
)
print(response.headers.get("X-Orca-Resolved-Model"))

Những gì OrcaRouter không đưa ra

Chúng tôi cố tình không thêm:

Một header hoặc trường phản hồi provider hay routed_to
Bất kỳ định danh định tuyến nội bộ hoặc URL backend upstream nào
Bất kỳ header nào cho người gọi biết upstream nào đã phục vụ yêu cầu

OrcaRouter là một nhà cung cấp duy nhất theo góc nhìn của ứng dụng bạn. Định tuyến nội bộ là việc của chúng tôi, không phải phụ thuộc của bạn.

Bộ định tuyến tự động Giới hạn tốc độ

​Đọc chúng trong mã

​Những gì OrcaRouter không đưa ra

Đọc chúng trong mã

Những gì OrcaRouter không đưa ra