에이전트 보안 기준선 은 자율성 제어입니다 — 별도의 “기준선” 객체가
없습니다. 자율성 수준을 적용하면 firewall 정책과 guardrail (수준의 이름을
딴)을 원자적으로 작성하고 하나의 트랜잭션에서 워크스페이스의 라이브 자세로
만듭니다. 나중에 열어서 편집할 수 있습니다. 원클릭 실행 취소는 감사 스냅샷에서
정확한 이전 상태를 복원합니다.
1. 자율성 제어가 하는 것
세 가지 수준, 각각이 동일한 두 레이어를 커버합니다:| 수준 | Firewall 자세 | Guardrails | Observe mode |
|---|---|---|---|
tight | 기본 거부; 파괴적 셸과 SSRF egress 거부 | PII Shield + Secrets Blocker 강제 | 끔 |
balanced | 기본 감사; 파괴적 셸 거부됨 | PII Shield 감사 전용 모드 (PII 플래그) | 끔 |
permissive | 강제 정책 없음 | Guardrails 없음 | 켬 — 모든 툴 호출이 커버리지 갭으로 로깅됨 |
balanced가 권장 시작 자세입니다. 에이전트가 하는 모든 것을 감사하고
PII를 플래그하면서, 여전히 가장 파괴적인 액션 (파괴적 셸)을 거부합니다
— 따라서 추가로 제한할 것을 결정하기 전에 에이전트의 실제 동작을 볼 수
있습니다. 아무것도 차단하지 않는 패스라면, permissive에서 시작하세요.
**tight**는 에이전트의 정상적인 동작을 이해하고 나면 올바른 목표입니다.
기본으로 기본 거부 자세를 강제합니다: 파괴적 셸 거부, SSRF egress 거부,
그리고 PII Shield와 Secrets Blocker guardrails 모두 활성화됩니다 (요청을
PII와 시크릿에 대해 검사).
**permissive**는 모든 강제를 끄지만 observe mode는 켜두어, 모든 툴 호출이
여전히 로깅됩니다. 실수로 차단될 위험 없이 브랜드 새 에이전트를 감사하는
데 사용하세요 — 그 다음 그것이 무엇을 하는지 알면 balanced 또는 tight로
이동하세요.
2. 수준을 적용하는 방법
변경 미리 보기 (선택 사항이지만 권장)
적용하기 전에 수준을 시뮬레이션하세요. 콘솔 Simulate 뷰 (Firewall →
Posture 아래) 또는 API가 활성화될 규칙과 guardrails를 정확히 보여줍니다
— 아무것도 변경되지 않습니다.역할: Member (읽기 전용, 변경 없음).
콘솔에서 수준 선택
콘솔에서 Firewall → Posture로 이동합니다. 자율성 수준 제어에서
balanced, tight, 또는 permissive를 선택하고 확인합니다. 변경은
다음 툴 호출에서 효력이 발생합니다 — 재배포 없음.역할: Developer+ 적용 필요.이벤트와 매치 관찰
적용 후, Firewall → Events / Runs로 가서 툴 호출 판정을 보고
Guardrails → Matches에서 콘텐츠 정책 히트를 봅니다. 두 피드 모두
실시간으로 업데이트됩니다. 예상치 못한 것이 발동하면, 더 강화하기 전에
검토하세요.
3. 권장 경로
balanced에서 시작 → tight 시뮬레이션 → 관찰 → 강화.
balanced적용 — 전체 감사 추적을 얻게 됩니다; 파괴적 셸만 거부되고, 다른 모든 것은 감사됩니다. 하루나 이틀 동안 에이전트를 정상적으로 실행합니다.tight시뮬레이션 —GET /api/workspace/firewall/simulate?level=tight를 실행하고 거부될 것과 Events 피드에서 본 것을 비교합니다. 파괴적 셸 호출이나 SSRF 스타일의 아웃바운드 요청이 정상 트래픽의 일부라면, 먼저 에이전트에서 그것들을 수정하세요.- Events와 Matches 관찰 — Firewall → Events가 모든 툴 호출 판정을 보여주고; Guardrails → Matches가 콘텐츠 정책 히트를 보여줍니다. 둘 다 판정, 툴, 실행, 세션으로 필터링 가능합니다.
tight적용 — 시뮬레이션 출력에 놀라움이 없으면,tight를 적용합니다. 프로덕션에서 무언가 깨지면 실행 취소가 한 번의 호출 거리입니다.- 규칙으로 조정 — Firewall 규칙을 사용하여 예외를 만들거나 프리셋 수준이 커버하지 않는 제어를 추가합니다. 자율성 수준이 기저이고; 커스텀 규칙이 정밀도를 추가합니다.
4. 역할 요구사항
| 액션 | 최소 역할 |
|---|---|
수준 시뮬레이션 (GET .../simulate) | Member |
| 감사 추적 읽기 | Member |
| Guardrail Matches 보기 | Member |
| Firewall Events & Runs 보기 | Developer+ |
| 자율성 수준 적용 | Developer+ |
| 자율성 변경 실행 취소 | Developer+ |
5. 이것이 아닌 것
- 블랙 박스가 아닙니다. 자율성 수준을 적용하면 실제 firewall 정책과 guardrail (수준의 이름을 딴)을 작성하고 워크스페이스의 라이브 자세로 만듭니다. 나중에 열어서 검사하고 편집할 수 있습니다 — 잠긴 프리셋이 아닌 빠른 시작점입니다.
- 제한 내에서 되돌릴 수 있습니다. 원클릭 실행 취소는 감사 스냅샷에서 이전 Firewall과 Guardrails 상태를 복원합니다. 스냅샷이 감사 로그 크기 제한을 초과하는 매우 큰 워크스페이스의 경우, 적용은 여전히 성공하지만 그 변경에 대한 실행 취소가 불가능합니다 — 대신 원하는 수준을 다시 적용합니다. 드물지만 알아둘 가치가 있습니다.
- 범위 지정 키의 대체가 아닙니다. 자율성 제어는 워크스페이스의 기본 자세를 설정합니다. 개별 API 키는 더 세밀한 제어를 위해 특정 정책에 여전히 연결될 수 있습니다. Guardrails vs. Firewall에서 레이어가 구성되는 방법을 참조하세요.
자율성 제어는 처음 30분을 위해 설계되었습니다 — 빠르게 보호받고, 에이전트의 실제 동작을 이해하고, 추측이 아닌 가시성의 위치에서 강화하세요.
퀵스타트
범위 지정 키와 guardrails를 포함한 5분 완전 제로 트러스트 설정.
Firewall
규칙 수준 세부 사항 — 판정, 표면, 인자 조건, HITL 승인.
