에이전트 보안 기준선

보호를 받기 위해 단 하나의 firewall 규칙도 작성할 필요가 없습니다. 자율성 제어 — 에이전트 보안 기준선이라고도 합니다 — 하나의 트랜잭션에서 워크스페이스에 완전한 제로 트러스트 자세를 적용합니다: Firewall 및 Guardrails, 함께, 원클릭 실행 취소로. 이것이 의미 있는 보안 자세로의 가장 빠른 경로입니다. 나중에 조정하기 위해 규칙을 작성하고; 여기서 시작하세요.

에이전트 보안 기준선 은 자율성 제어입니다 — 별도의 “기준선” 객체가 없습니다. 자율성 수준을 적용하면 firewall 정책과 guardrail (수준의 이름을 딴)을 원자적으로 작성하고 하나의 트랜잭션에서 워크스페이스의 라이브 자세로 만듭니다. 나중에 열어서 편집할 수 있습니다. 원클릭 실행 취소는 감사 스냅샷에서 정확한 이전 상태를 복원합니다.

1. 자율성 제어가 하는 것

세 가지 수준, 각각이 동일한 두 레이어를 커버합니다:

수준	Firewall 자세	Guardrails	Observe mode
`tight`	기본 거부; 파괴적 셸과 SSRF egress 거부	PII Shield + Secrets Blocker 강제	끔
`balanced`	기본 감사; 파괴적 셸 거부됨	PII Shield 감사 전용 모드 (PII 플래그)	끔
`permissive`	강제 정책 없음	Guardrails 없음	켬 — 모든 툴 호출이 커버리지 갭으로 로깅됨

balanced가 권장 시작 자세입니다. 에이전트가 하는 모든 것을 감사하고 PII를 플래그하면서, 여전히 가장 파괴적인 액션 (파괴적 셸)을 거부합니다 — 따라서 추가로 제한할 것을 결정하기 전에 에이전트의 실제 동작을 볼 수 있습니다. 아무것도 차단하지 않는 패스라면, permissive에서 시작하세요. **tight**는 에이전트의 정상적인 동작을 이해하고 나면 올바른 목표입니다. 기본으로 기본 거부 자세를 강제합니다: 파괴적 셸 거부, SSRF egress 거부, 그리고 PII Shield와 Secrets Blocker guardrails 모두 활성화됩니다 (요청을 PII와 시크릿에 대해 검사). **permissive**는 모든 강제를 끄지만 observe mode는 켜두어, 모든 툴 호출이 여전히 로깅됩니다. 실수로 차단될 위험 없이 브랜드 새 에이전트를 감사하는 데 사용하세요 — 그 다음 그것이 무엇을 하는지 알면 balanced 또는 tight로 이동하세요.

2. 수준을 적용하는 방법

변경 미리 보기 (선택 사항이지만 권장)

적용하기 전에 수준을 시뮬레이션하세요. 콘솔 Simulate 뷰 (Firewall → Posture 아래) 또는 API가 활성화될 규칙과 guardrails를 정확히 보여줍니다 — 아무것도 변경되지 않습니다.

# tight 시뮬레이션 — 전체 정책 diff를 반환하고, 아무것도 적용되지 않음
GET /api/workspace/firewall/simulate?level=tight

역할: Member (읽기 전용, 변경 없음).

콘솔에서 수준 선택

콘솔에서 Firewall → Posture로 이동합니다. 자율성 수준 제어에서 balanced, tight, 또는 permissive를 선택하고 확인합니다. 변경은 다음 툴 호출에서 효력이 발생합니다 — 재배포 없음.역할: Developer+ 적용 필요.

또는 API를 통해 적용

POST /api/workspace/firewall/autonomy
Content-Type: application/json

{ "level": "balanced" }

응답에는 audit_id가 포함됩니다 — 보관하세요. 실행 취소에 필요합니다.역할: Developer+.

이벤트와 매치 관찰

적용 후, Firewall → Events / Runs로 가서 툴 호출 판정을 보고 Guardrails → Matches에서 콘텐츠 정책 히트를 봅니다. 두 피드 모두 실시간으로 업데이트됩니다. 예상치 못한 것이 발동하면, 더 강화하기 전에 검토하세요.

필요하면 실행 취소

모든 자율성 변경은 하나의 호출로 실행 취소할 수 있습니다. 실행 취소는 일반 재설정이 아닌 감사 스냅샷에서 정확한 이전 상태를 복원합니다 — 정책, 규칙, guardrails, 설정.

POST /api/workspace/firewall/autonomy/undo/:audit_id

역할: Developer+.audit_id는 수준을 적용할 때 반환됩니다 (3단계) 그리고 Firewall → Audit에서도 볼 수 있습니다.

3. 권장 경로

balanced에서 시작 → tight 시뮬레이션 → 관찰 → 강화.

balanced 적용 — 전체 감사 추적을 얻게 됩니다; 파괴적 셸만 거부되고, 다른 모든 것은 감사됩니다. 하루나 이틀 동안 에이전트를 정상적으로 실행합니다.
tight 시뮬레이션 — GET /api/workspace/firewall/simulate?level=tight를 실행하고 거부될 것과 Events 피드에서 본 것을 비교합니다. 파괴적 셸 호출이나 SSRF 스타일의 아웃바운드 요청이 정상 트래픽의 일부라면, 먼저 에이전트에서 그것들을 수정하세요.
Events와 Matches 관찰 — Firewall → Events가 모든 툴 호출 판정을 보여주고; Guardrails → Matches가 콘텐츠 정책 히트를 보여줍니다. 둘 다 판정, 툴, 실행, 세션으로 필터링 가능합니다.
tight 적용 — 시뮬레이션 출력에 놀라움이 없으면, tight를 적용합니다. 프로덕션에서 무언가 깨지면 실행 취소가 한 번의 호출 거리입니다.
규칙으로 조정 — Firewall 규칙을 사용하여 예외를 만들거나 프리셋 수준이 커버하지 않는 제어를 추가합니다. 자율성 수준이 기저이고; 커스텀 규칙이 정밀도를 추가합니다.

4. 역할 요구사항

액션	최소 역할
수준 시뮬레이션 (`GET .../simulate`)	Member
감사 추적 읽기	Member
Guardrail Matches 보기	Member
Firewall Events & Runs 보기	Developer+
자율성 수준 적용	Developer+
자율성 변경 실행 취소	Developer+

5. 이것이 아닌 것

블랙 박스가 아닙니다. 자율성 수준을 적용하면 실제 firewall 정책과 guardrail (수준의 이름을 딴)을 작성하고 워크스페이스의 라이브 자세로 만듭니다. 나중에 열어서 검사하고 편집할 수 있습니다 — 잠긴 프리셋이 아닌 빠른 시작점입니다.
제한 내에서 되돌릴 수 있습니다. 원클릭 실행 취소는 감사 스냅샷에서 이전 Firewall과 Guardrails 상태를 복원합니다. 스냅샷이 감사 로그 크기 제한을 초과하는 매우 큰 워크스페이스의 경우, 적용은 여전히 성공하지만 그 변경에 대한 실행 취소가 불가능합니다 — 대신 원하는 수준을 다시 적용합니다. 드물지만 알아둘 가치가 있습니다.
범위 지정 키의 대체가 아닙니다. 자율성 제어는 워크스페이스의 기본 자세를 설정합니다. 개별 API 키는 더 세밀한 제어를 위해 특정 정책에 여전히 연결될 수 있습니다. Guardrails vs. Firewall에서 레이어가 구성되는 방법을 참조하세요.

자율성 제어는 처음 30분을 위해 설계되었습니다 — 빠르게 보호받고, 에이전트의 실제 동작을 이해하고, 추측이 아닌 가시성의 위치에서 강화하세요.

퀵스타트

범위 지정 키와 guardrails를 포함한 5분 완전 제로 트러스트 설정.

Firewall

규칙 수준 세부 사항 — 판정, 표면, 인자 조건, HITL 승인.

​1. 자율성 제어가 하는 것

​2. 수준을 적용하는 방법

​3. 권장 경로

​4. 역할 요구사항

​5. 이것이 아닌 것

퀵스타트

Firewall

1. 자율성 제어가 하는 것

2. 수준을 적용하는 방법

3. 권장 경로

4. 역할 요구사항

5. 이것이 아닌 것