1. ai guardrail 템플릿 라이브러리가 주는 것
프리셋은 완전한Policy(하나 이상의 순서가 있는 규칙)를 생성 모달에
떨어뜨리는 이름이 지정된 시작점입니다. 프리셋은 서버 측에서 작성되므로,
콘솔 선택기, Test 샌드박스, 그리고
이 문서가 모두 정확히 동일한 동작을 기술합니다 — 하나의 진실 소스가
있습니다.
모든 프리셋은 씨앗이지 잠금이 아닙니다. 하나를 적용하면, 그 복사본을
소유합니다: 이름을 바꾸고, 규칙을 추가하거나 삭제하고, 규칙의
액션이나
스테이지를 변경하고, 탐지기를 다시
튜닝하세요. 원본 템플릿의 어느 것도 당신의 편집을 제약하지 않습니다.
프리셋을 적용하는 것은, 모든 guardrail 작성과 마찬가지로, 당신 자신의
워크스페이스 세션에서의 콘솔 액션이며, guardrail을 생성하거나
편집하려면 워크스페이스에서 **Developer+**가 필요합니다. 최종
/v1/*
릴레이 호출만 sk-orca-... 키를 사용합니다.2. 프리셋 카테고리
선택기는 프리셋을 여덟 카테고리로 그룹화합니다. 각각이 그렇지 않으면 손으로 구축할 흔한 제어에 매핑됩니다:PII — 개인 데이터 마스킹 또는 차단
PII — 개인 데이터 마스킹 또는 차단
이메일, 전화, SSN, 카드, IP 등을 탐지하고 마스킹(또는 차단)합니다.
한 규칙 마스킹은 PII Shield에서,
또는 PII가 결코 프로바이더에 도달해서는 안 될 때 엄격한 차단기에서
시작하세요.
Secrets — 자격 증명을 프롬프트에서 차단
Secrets — 자격 증명을 프롬프트에서 차단
AWS / OpenAI / GitHub 키, PEM 개인 키, 클라우드 토큰, 암호화폐 지갑
주소가 게이트웨이를 떠나기 전에 차단합니다.
시크릿 차단을 참조하세요.
Compliance — 규제 데이터 레일
Compliance — 규제 데이터 레일
PCI 카드 차단, EU/UK 식별자 차단, 의료 식별자 차단, 그리고 트래픽을
변경하지 않고 PII 발생을 기록하는 관찰 전용
컴플라이언스 로거.
Safety — 인젝션, 탈옥, 자해
Safety — 인젝션, 탈옥, 자해
프롬프트 인젝션 문구, 탈옥 / 역할 놀이 패턴, 시스템 프롬프트 유출 탐지,
그리고 자해 거부 목록을 위한 keyword/regex 레일.
프롬프트 인젝션을
참조하세요.
Cost — 크기 및 길이 상한
Cost — 크기 및 길이 상한
비용과 지연 시간을 한정하기 위한 요청 프롬프트와 모델 응답의
max_chars 상한.
비용 guardrails를
참조하세요.Agent — 에이전틱 콘텐츠 필터
Agent — 에이전틱 콘텐츠 필터
에이전트 흐름을 위한 URL 필터, 마크다운 이미지 차단(이미지 유출
방어), 셸 인젝션 패턴, 그리고 출력 내 SQL 인젝션 필터.
에이전틱 guardrails를
참조하세요.
Code security — 시크릿, 라이선스, 위험한 API
Code security — 시크릿, 라이선스, 위험한 API
.env / 시크릿 파일 할당 차단, 요청과 모델 출력의 강력한 카피레프트
라이선스 플래그(GPL / AGPL / LGPL / SSPL), 그리고 고위험
싱크(eval, os.system, pickle.loads)를 참조하는 프롬프트에 주석을
다는 비차단 권고.
코드 보안을 참조하세요.3. 프리셋을 씨앗으로 적용하기
여기 모든 단계는 콘솔 액션입니다. 릴레이 키는 최종 요청에서만 나타납니다.프리셋 선택
하나를 선택합니다 — 예: PII 카테고리에서 PII Shield. 완전한
정책(여기서는, 단일 마스킹
pii 규칙)을 씨앗으로 만듭니다. 선택기는
각 프리셋의 설명을 보여주므로 적용하기 전에 무엇을 하는지 압니다.이름 지정 및 자유롭게 편집
이름을 지정합니다(≤ 64자). 씨앗 규칙은 이제 당신의 것입니다 — 그것들
중 어느 것이든 추가, 삭제, 또는 다시 튜닝하세요. 프리셋은 씨앗이지
잠금이 아닙니다.
연결하기 전에 테스트
Test 탭을 열고, 샘플을 붙여넣고, 스테이지를 선택한 뒤, 정책을
로컬에서 실행합니다 — 업스트림 호출 없음, 쿼터 없음. 어떤 키가 그것을
가리키기 전에 예상한 것을 하는지 증명하세요.
4. 하나의 구체적인 예: 씨앗, 그 다음 강제
PII Shield 프리셋을 적용합니다. 정확히 하나의 규칙을 씨앗으로 만듭니다:[EMAIL]로 마스킹합니다. 카드 번호를
담은 요청은 HTTP 400 guardrail_blocked로 거부됩니다 — 이는 쿼터를
소모하지 않으며(입력 차단은 계량 전에 발동) skip-retry로
표시됩니다.
guardrail_blocked 오류를
참조하세요.
5. 적용한 후 — 나머지는 엔진
프리셋은 단지 규칙을 작성하는 빠른 방법입니다. 다운스트림의 모든 것은 일반 guardrail 엔진입니다:| 얻는 것 | 어디서 |
|---|---|
| 규칙별 액션 | 액션 |
| 테스트 + 평가 | 테스트 및 평가 |
| 무엇이 발동했는지 | Matches 피드 |
| 변경 롤백 | 버전 관리 |
guardrail에 대한 모든 생성, 업데이트, 삭제는 — 프리셋을 적용하고 저장하는
순간을 포함하여 — 버전 관리된 히스토리 행을 씁니다. 임의의 두 버전을
diff하고 더 이전 것으로 되돌릴 수 있으므로, 씨앗 정책을 편집하는
것은 결코 일방통행 문이 아닙니다.
버전 관리를 참조하세요.
6. 다음으로 갈 곳
PII Shield
원클릭 PII 마스킹 프리셋, 시작부터 끝까지.
시크릿 차단
Secrets Blocker 프리셋 — 요청의 키와 자격 증명을 잡습니다.
에이전틱 guardrails
에이전트 흐름을 위한 URL, 마크다운 이미지, 셸, SQL 필터.
Guardrails 레퍼런스
완전한 엔진 — 모든 규칙 타입, 필드, 라우트.
