حواجز الحماية مقابل جدار الحماية للوكيل — متى تستخدم أيّهما

الإجابة القصيرة: حواجز الحماية تحكم النص؛ جدار الحماية يحكم الإجراءات. إنهما متكاملان — طلب واحد يتدفق عبر كليهما — وأسرع طريقة لضبطهما معاً هي مستوى استقلالية. بقية هذه الصفحة للحالات التي تحتاج فيها إلى معرفة أي طبقة تمتلك تهديداً محدداً.

الدور المطلوب. يستطيع أي عضو في مساحة العمل قراءة السياسات وتغذية Matches لحواجز الحماية؛ تغذية Events لجدار الحماية تتطلب دور Developer. إنشاء أو تحرير حواجز الحماية أو سياسات جدار الحماية يتطلب أيضاً Developer أو أعلى.

1. التمييز في جملة واحدة

الطبقة	تحكم	ترى
حواجز الحماية	النص — ما يقرأه النموذج ويكتبه	محتوى المطالبة، محتوى الاستجابة
جدار الحماية للوكيل	الإجراءات — ما يفعله الوكيل	استدعاءات الأدوات، إرسالات MCP، وجهات الشبكة الصادرة

تُطلَق حواجز الحماية قبل الاستدعاء الأعلى (على المطالبة) وبعده (على الاستجابة). يُطلَق جدار الحماية على كل استدعاء أداة يُصدره النموذج أو الوكيل — بصرف النظر عن النموذج أو المزود الذي خدم الجولة.

2. مقارنة جنباً إلى جنب

البُعد	حواجز الحماية	جدار الحماية للوكيل
تحكم	نص المطالبة ونص استجابة النموذج	استدعاءات الأدوات، إرسالات MCP، وجهات الخروج، تكلفة الوكيل
ترى	رسالة المستخدم ومطالبة النظام ورد النموذج	اسم الأداة ووسائط الاستدعاء واستدعاءات الأداة التي يُصدرها النموذج والمضيف/IP الصادر
تُربط عبر	`guardrail_id` على مفتاح API	`firewall_policy_id` على مفتاح API
أنواع القواعد	`keyword`، `regex`، `pii`، `max_chars`، `external`، `llm_judge`، `grounding`	أنماط glob لاسم الأداة + عبارات الوسائط + نطاق egress + ملكية المهارة
أمثلة التهديدات	PII في المطالبات، أسرار API في الاستجابات، jailbreaks، مخرجات خارج الموضوع، سياق مفرط الحجم	استدعاء أداة خطير، SSRF، تسريب بيانات، حلقة تكلفة وكيل متهالكة، خادم MCP غير موافق عليه
الأحكام / الإجراءات	`block` (HTTP 400 `guardrail_blocked`)، `mask`، `flag`	`allow`، `audit`، `deny` (HTTP 400 `firewall_blocked`)، `sanitize`، `pending_approval`، `cap_cost`
متى تُطلَق	مرحلة المدخلات: قبل استدعاء النموذج؛ مرحلة المخرجات: بعد رد النموذج	على كل استدعاء أداة يُصدره النموذج أو الوكيل
وضع الظل / المراقبة	لا — حواجز الحماية تُطلَق أو لا تُطلَق	نعم — وضع الظل يُخفَّض الأحكام المُطبِّقة إلى `audit` للطرح الآمن

3. التهديد ← أي طبقة

استخدم هذا الجدول لتوجيه متطلب أمان جديد إلى الضبط الصحيح:

التهديد	العلاج
PII في رسالة مستخدم	حواجز الحماية — قاعدة `pii` على المدخلات (`mask` / `block`)
سر في استجابة النموذج	حواجز الحماية — قاعدة أسرار على المخرجات
استدعاء أداة خطير (`shell.exec rm -rf /`)	جدار الحماية — `deny` على أنماط glob للأداة + عبارة وسائط
SSRF / تسريب بيانات عبر URL صادر	جدار الحماية — قائمة سماح/رفض egress
حقن مطالبة من محتوى غير موثوق	كلاهما — حاجز مدخلات + قائمة سماح جدار الحماية
سر في وسيطة أداة	جدار الحماية `sanitize` + قاعدة أسرار حواجز الحماية
Jailbreak / تجاوز السياسة	حواجز الحماية — `llm_judge` / keyword / regex
مطالبة مفرطة الحجم أو تكلفة رموز	حواجز الحماية — قاعدة `max_chars`
إنفاق وكيل متهالك (حلقة تكلفة)	جدار الحماية — حكم `cap_cost`
خادم MCP غير موافق عليه	جدار الحماية — رفض سطح MCP / `pending_approval`
بيانات حساسة من نتيجة أداة	حواجز الحماية — قاعدة مخرجات على الاستجابة

“لماذا” العميق لكل تزاوج يعيش في صفحات التعمق التهديدات.

4. استخدم كليهما — مستويات الاستقلالية تضبطهما معاً

صُممت حواجز الحماية وجدار الحماية للتركيب، وليس التنافس. طلب واحد يمر عبر كلا المستويين:

يعمل حاجز مدخلات — نص المطالبة يُفحص ويُخفى اختيارياً.
استدعاء النموذج — المطالبة (المُعقَّمة ربما) تصل للنموذج الأعلى.
جدار الحماية — كل استدعاء أداة يُصدره النموذج يُقيَّم.
يعمل حاجز مخرجات — نص استجابة النموذج يُفحص.

أسرع طريقة لضبط كليهما دفعة واحدة هي مستوى استقلالية — إعداد واحد يكتب بشكل ذري سياسة Firewall وسياسة Guardrails لكامل مساحة العمل، مع التراجع بنقرة واحدة:

مستوى الاستقلالية	موقف جدار الحماية	موقف حواجز الحماية
`tight`	حجب افتراضي؛ حجب shell المدمّر + خروج SSRF	PII Shield + الأسرار مفعّلة
`balanced`	تدقيق افتراضي؛ رفض shell المدمّر	PII Shield بوضع تدقيق فقط (يُعلّم PII)
`permissive`	لا قواعد مُطبِّقة؛ وضع observe مفعّل	لا تطبيق

طبّق مستوى استقلالية من وحدة تحكم Firewall (POST /api/workspace/firewall/autonomy، Developer+)، ثم اضبط كل مستوى بشكل مستقل من هناك.

5. الملخص

حواجز الحماية تمتلك النص؛ جدار الحماية يمتلك الإجراءات — شغّل كليهما، دع مستوى الاستقلالية يربطهما معاً، وشدّد كل مستوى بشكل مستقل بمجرد رؤية حركة مرور وكلائك الحقيقية.