메인 콘텐츠로 건너뛰기
당신은 개인 데이터를 업스트림 모델에서 차단하고 싶습니다. 고객이 이메일 주소를 붙여넣고, 지원 기록이 카드 번호를 운반하고, 에이전트 프롬프트가 SSN을 유출합니다 — 그 어느 것도 OpenAI, Anthropic, 또는 Google에 평문으로 도달해서는 안 됩니다. PII Shield는 그것을 고치는 가장 빠른 방법입니다: 요청에서 민감한 엔티티를 탐지하고 게이트웨이가 호출을 전달하기 전에 각각을 타입 지정된 태그로 마스킹하는 단일 규칙 guardrail 프리셋입니다. 이것은 PII 마스킹 유스 케이스에 초점을 둔 랜딩입니다. 전체 guardrail 엔진 — 모든 규칙 타입, 필드, 라우트 — 은 Guardrails 레퍼런스를 참조하세요.

1. 규칙 하나로 PII 마스킹 LLM 유스 케이스

pii 마스킹 llm 배관의 어려운 부분은 보통 배관입니다. PII Shield가 그것을 제거합니다. 프리셋은 단일 pii 규칙입니다:
  • Type: PII detection (pii)
  • Action: Mask — 각 매치를 타입 지정된 태그로 대체
  • Entities: email, phone, ssn, credit_card, ip
콘솔에서 한 번 적용하고, 키에 연결하면, 그 키의 모든 호출이 SDK 변경 없이, 재배포 없이 검사됩니다. 정책은 애플리케이션이 아니라 게이트웨이에 존재합니다 — 당신의 앱은 이전과 정확히 동일하게 /v1/chat/completions를 계속 호출합니다.
입력 스테이지 마스킹이 라이브 경로입니다. PII Shield는 요청이 게이트웨이를 떠나기 전에 그것을 마스킹하므로, 업스트림 모델은 원본 값을 결코 보지 못합니다. 모델 출력과 스트리밍 응답의 라이브 마스킹은 로드맵에 있습니다; PII Shield를 돌아오는 것이 아니라 당신이 보내는 것을 정화하는 것으로 이해하세요. 오늘날 모델 응답을 게이트하려면, 출력 block 규칙이 양방향으로 강제됩니다 — 출력 스테이지 규칙스트리밍 커버리지를 참조하세요.

2. 콘솔에서 프리셋 적용하기

여기 모든 단계는 당신의 세션에서 호스팅된 게이트웨이에 대한 콘솔 액션입니다. guardrail을 생성하고 편집하려면 워크스페이스에서 **Developer+**가 필요합니다. 최종 /v1/* 호출만 sk-orca-... 릴레이 키를 사용합니다.
1

템플릿 열기

콘솔에서 Guardrails를 열고, New guardrail 분할 버튼을 클릭한 뒤, PII 템플릿 카테고리에서 PII Shield를 선택합니다. 단일 마스킹 pii 규칙을 씨앗으로 만듭니다.
2

이름 지정 및 저장

이름을 지정하고(≤ 64자), 예: pii-shield, 저장합니다. 프리셋은 씨앗이지 잠금이 아닙니다 — 이후에 엔티티 목록이나 액션을 자유롭게 편집하세요.
3

테스트

Test 탭을 열고, input 스테이지에서 샘플을 붙여넣고, 정책을 로컬에서 실행합니다 — 업스트림 호출 없음, 쿼터 없음 (§4 참조).
4

키 연결

API 키를 편집하고 Guardrail 드롭다운에서 pii-shield를 선택하거나(키에 guardrail_id 설정), 워크스페이스 기본값으로 표시합니다. 키에 연결하기계정 기본값을 참조하세요.

3. 무엇이 무엇으로 마스킹되는가

mask 액션에서 각 매치는 타입 지정된 태그로 대체됩니다 — 이메일은 [EMAIL]이, SSN은 [SSN]이 됩니다. 내장 탐지기 세트는 닫혀 있으며 엔진, 샌드박스, 규칙 빌더가 공유합니다:
email, phone, credit_card, ssn, ip, iban, mac_address, jwt, aws_access_key, api_key_openai, bitcoin_address.
jp_mynumber(일본 My Number → [JP_MYNUMBER]), kr_rrn(한국 주민등록번호 → [KR_RRN]), 그리고 cn_resident_id(중국 거주자 ID → [CN_RESIDENT_ID]). 당신의 관할권에 맞는 것을 활성화하세요.
내장 위에 정규식 탐지기를 얹으세요 — employee_id, 내부 계정 번호 — 선택적 luhn 체크섬과 커스텀 대체 문자열과 함께. 규칙당 최대 25개. 커스텀 PII 엔티티마스킹 형식을 참조하세요.
하나의 PII 규칙은 entity_actions를 통해 서로 다른 엔티티에 서로 다른 액션을 적용할 수 있습니다 — email / phone / ip를 마스킹하되, credit_cardssn에서는 block. 겹치는 규칙이 필요 없습니다. 액션을 참조하세요.

4. 연결하기 전에 테스트하기

어떤 키가 그것을 가리키기 전에 규칙이 예상대로 동작함을 증명하세요. 에디터 내부의 Test 탭을 열고, 샘플을 붙여넣고, input 스테이지를 선택한 뒤 실행합니다:
Reply to jane@acme.com please
샌드박스는 현재 정책을 로컬에서 평가하고 판정과 렌더링된 텍스트를 반환합니다 — 업스트림으로 아무것도 보내지 않고, 아무것도 계량되지 않습니다:
Reply to [EMAIL] please
코퍼스에 대한 A/B 그리드는 한 탭 옆의 평가 하니스에 있습니다.

5. 요청 전송

pii-shield에 바인딩된 키를 사용하여, 이전과 정확히 동일하게 OrcaRouter를 호출합니다 — 새 헤더 없음, SDK 변경 없음:
curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "Reply to jane@acme.com please"}
    ]
  }'
게이트웨이는 전달하기 전에 이메일을 [EMAIL]로 마스킹합니다 — 업스트림 모델은 Reply to [EMAIL] please를 받고 주소는 결코 보지 못합니다.
엔티티의 액션을 (엔티티별 오버라이드를 통해) block으로 바꾸면 그 엔티티를 담은 바로 다음 요청은 HTTP 400 guardrail_blocked로 거부됩니다. 차단된 요청은 쿼터를 소모하지 않으며(입력 차단은 계량 전에 발동) skip-retry로 표시됩니다. guardrail_blocked 오류를 참조하세요.

6. 무엇이 발동했는지 보기

발동하는 모든 규칙은 match를 기록합니다 — 규칙 타입, 액션, 스테이지, 그리고 상세 문자열 — 워크스페이스 Matches 피드에 표시됩니다. 매치된 부분 문자열 자체(실제 이메일 주소)는 Log raw content가 켜져 있을 때 기록되며, 이는 기본적으로 꺼져 있습니다 — 마스킹된 PII를 당신 자신의 텔레메트리에서도 차단하는 프라이버시 보수적 자세입니다.
마스킹 제어의 경우, Log raw content를 꺼둔 채로 두는 것이 보통 핵심입니다: 방금 정화한 값을 다시 캡처하지 않고도 email이 마스킹되었다는 사실과 그것이 얼마나 자주인지 볼 수 있습니다. 분류를 위해 부분 문자열이 필요할 때만 guardrail별로 켜세요; 이 설정은 소급되지 않습니다. Matches 피드로깅 및 프라이버시를 참조하세요.

7. 다음으로 갈 곳

커스텀 PII 엔티티

선택적 Luhn 검사와 함께 자신의 정규식 탐지기를 규칙당 최대 25개까지 추가합니다.

마스킹 형식

각 엔티티가 렌더링되는 타입 지정된 태그를 제어합니다.

시크릿 차단

Secrets Blocker 프리셋으로 API 키와 자격 증명을 잡습니다.

거짓 양성 튜닝

Matches 피드에서 거짓 양성을 표시하고 탐지기를 조입니다.
PII Shield는 콘텐츠를 마스킹합니다. 에이전트의 툴 호출을 관리하려면 — 파괴적 액션 거부, 툴 호출 인자 마스킹, 승인 요구 — Firewall을 사용하세요. AI 에이전트 보안데이터 유출 위협에서 시작하거나, 완전한 엔진은 Guardrails 레퍼런스를 읽으세요.