guardrail_id를 설정하면 그 키로
하는 모든 /v1/* 호출이 다음 요청에서 검사됩니다 — 재배포 없이, SDK
변경 없이.
이 페이지는 바인딩만 다룹니다 — 연결하는 방법, 해석이 유효 정책을
선택하는 방법, 그리고 오프 스위치가 하는 일. 규칙 타입, 액션, 스테이지는
Guardrails 레퍼런스를 참조하세요.
1. guardrail_id로 API 키별 guardrail 바인딩하기
guardrail은 워크스페이스 범위이지만, 강제는 키별로 결정됩니다. 각
API 키는
guardrail_id 필드를 운반합니다. 그것을 guardrail로 가리키면 그 키 —
그리고 오직 그 키만 — 가 그 정책으로 검사됩니다.
이는 한 워크스페이스가 서로 다른 키에서 서로 다른 정책을 실행하게
합니다:
- 엄격한
pii-blocker에 바인딩된 프로덕션 키, - 더 가벼운
flag-only정책에 바인딩된 스테이징 키, - 아무것도 연결되지 않은 내부 키.
https://api.orcarouter.ai/v1/chat/completions를 계속
호출합니다.
릴레이 키(
sk-orca-…)는 당신의 앱이 보내는 것입니다. 거기에 guardrail을
연결하는 것은 당신의 세션으로 인증되는 콘솔 / 토큰 API 액션입니다 —
릴레이 키 자체로 guardrail을 구성하는 일은 결코 없습니다.2. 콘솔에서 연결하기
콘솔에서 바인딩을 구성합니다(역할 게이팅: 키와 guardrail 편집에는 **Developer+**가 필요합니다).
그 후, 바인딩된 키로 하는 정상 릴레이 호출은 자동으로 검사됩니다:
[EMAIL]을 보고 주소는 결코 보지 못합니다 — 동일한 호출,
클라이언트 변경 없음.
3. 해석이 유효 guardrail을 선택하는 방식
모든 요청에서 게이트웨이는 정확히 하나의 유효 guardrail(또는 없음)을 다음 순서로 해석합니다:1 — 명시적 키 연결
1 — 명시적 키 연결
키의
guardrail_id가 guardrail을 가리키고 그리고 그 guardrail이
존재하며 그리고 활성화되어 있으면, 그것이 적용됩니다. 명시적
연결은 권위적입니다 — 워크스페이스 기본값으로 조용히 폴백하지
않습니다.2 — 워크스페이스 기본값
2 — 워크스페이스 기본값
키에 연결이 없으면(
guardrail_id가 0/설정 안 됨), 워크스페이스의
활성화된 기본 guardrail이(설정되어 있다면) 적용됩니다.3 — 둘 다 해석되지 않음
3 — 둘 다 해석되지 않음
강제 없음. 요청은 기능을 한 번도 활성화하지 않은 워크스페이스와 바이트
단위로 동일합니다 — 아무것도 차단, 마스킹, 또는 로깅되지 않습니다.
4. 오프 스위치: 연결 비활성화, 폴백 없음
이것이 사람들이 놓치는 부분입니다. 명시적 키 연결은 그 자체로 권위입니다 — 따라서 연결된 guardrail을 비활성화하면 그 키에 대한 강제가 OFF가 되고, 워크스페이스 기본값으로 폴백하지 않습니다.| 키 상태 | 무엇이 요청을 검사하는가 |
|---|---|
guardrail_id → 활성화된 guardrail | 그 guardrail |
guardrail_id → 비활성화된 guardrail | 없음(폴백 없음) |
guardrail_id → 삭제됨 / 누락됨 | 없음(폴백 없음) |
guardrail_id = 0 / 설정 안 됨 | 워크스페이스 기본값(있다면) |
5. 바인딩 분리 또는 지우기
특정 guardrail로 키 검사를 중단하려면, 결과가 다른 두 가지 별개의 동작이 있습니다:- 연결 지우기 — 키의
guardrail_id를0으로 설정합니다. 이제 키는 워크스페이스 기본값(있다면)으로, 또는 없음으로 해석됩니다. - guardrail 비활성화 — guardrail의
enabled를 끕니다. 명시적으로 거기에 연결된 모든 키는 이제 없음으로 해석되고(§4에 따라), 그것을 워크스페이스 기본값으로 의존하던 키는 강제 없음으로 떨어집니다.
6. 검사된 요청이 비용을 얼마나 발생시키는가(그리고 아닌가)
guardrail이 해석되면, 그 규칙이 요청을 결정합니다. 바인딩된 키에 대해 알아둘 가치가 있는 두 가지 결과:- block은 오류 코드
guardrail_blocked와 함께 HTTP 400을 반환하며, 발동한 guardrail과 규칙을 명시합니다. 쿼터를 소모하지 않습니다 — 입력 스테이지 차단은 계량 전에 발동하고, 출력 스테이지 차단은 사전 소모된 쿼터를 환불합니다 — 그리고 skip-retry로 표시됩니다. - mask는 매치를 타입 지정된 태그(예:
[EMAIL])로 재작성하고 정화된 요청을 통과시킵니다; 업스트림 모델은 원본을 결코 보지 못합니다.
guardrail_blocked 오류
페이지를, 출력 규칙이 스트리밍 응답에서 어떻게 동작하는지는
스트리밍 커버리지를
참조하세요.
7. 다음으로 갈 곳
첫 guardrail 생성하기
키에 바인딩할 정책을 만듭니다.
계정 기본 guardrail
워크스페이스의 모든 키를 한 번에 검사합니다.
Guardrails 레퍼런스
규칙 타입, 액션, 스테이지, PII, judge, grounding.
키, 정책 및 워크스페이스
바인딩이 게이트웨이 전반에서 어떻게 범위 지정되는지.
