메인 콘텐츠로 건너뛰기

무엇을 지불하는가

OrcaRouter는 토큰별 마크업 없이 업스트림 프로바이더가 공개한 토큰 단가를 청구합니다. 수익은 선택적 유료 구독 플랜에서 발생하며, 토큰 비용을 부풀리지 않습니다.

usage 객체

모든 chat/responses 응답에는 usage 필드가 포함됩니다:
{
  "usage": {
    "prompt_tokens": 12,
    "completion_tokens": 34,
    "total_tokens": 46
  }
}
추론 모델은 숨겨진 추론 패스를 위해 completion_tokens_details.reasoning_tokens를 추가합니다.

내장 도구 요금

응답이 내장 / 서버 측 도구를 사용하면 그 호출이 카운트되어 토큰 사용량 위에 청구됩니다. OrcaRouter는 업스트림 프로바이더의 호출당 요율을 마크업 없이 전달합니다; 현재 요율은 각 프로바이더의 가격 페이지를 참조하세요. 프로바이더 전반에서 호출당 요금을 발생시키는 도구:
  • OpenAIweb_search, web_search_preview, image_generation (Responses API 내장 도구)
  • Anthropicweb_search (서버 도구)
  • Google GeminigoogleSearch 그라운딩 (Gemini 2.x 패밀리 의 그라운드된 프롬프트당; Gemini 3.x 패밀리의 쿼리당)
  • xAI Grokweb_search, x_search, code_interpreter (/v1/responses의 Agent Tools API)
현재 전달되는 특정 OpenAI 요율:
도구호출당 요율
web_search1,000회 호출당 $10 (모델 간 통합)
web_search_preview추론 모델(o3*, o4*, gpt-5*)의 경우 10/1k;비추론모델(gpt4o,gpt4.1)의경우10 / 1k; 비추론 모델(`gpt-4o*`, `gpt-4.1*` 등)의 경우 25 / 1k
다른 프로바이더의 서버 도구 요율은 각 프로바이더의 공식 가격 페이지를 참조하세요.

OrcaRouter 응답 헤더

헤더설정 시점
X-Orca-Fallback-Level응답을 처리한 폴백 모델의 인덱스
X-Orca-Fallback-Model폴백 모델의 이름
X-Orca-Router사용된 orcarouter/{name} 라우터의 이름
X-Orca-Resolved-Model이름 지정 라우터가 해결한 구체 모델
사용 사례는 라우팅 / 응답 헤더를 참조하세요.

사용량 조회

대시보드 orcarouter.ai/console는 일일 지출, 선택한 기간의 총 지출, 모델별 분석을 표시합니다. 대시보드는 현재 API 키별 지출 분석을 지원하지 않습니다 — 비용은 워크스페이스 레벨에서 집계됩니다. 프로그램적 접근을 위해 두 개의 OpenAI 형태 청구 엔드포인트도 노출됩니다:
# 현재까지의 총 사용량 (TotalUsage가 있는 OpenAIUsageResponse 반환)
curl https://api.orcarouter.ai/v1/dashboard/billing/usage \
  -H "Authorization: Bearer sk-orca-..."

# 남은 할당량과 만료 (OpenAISubscriptionResponse 반환)
curl https://api.orcarouter.ai/v1/dashboard/billing/subscription \
  -H "Authorization: Bearer sk-orca-..."
이는 요약 엔드포인트입니다 — OpenAI의 전체 일별 과거 분석은 포함하지 않습니다.