الانتقال إلى المحتوى الرئيسي
الإجابة القصيرة: حواجز الحماية تحكم النص؛ جدار الحماية يحكم الإجراءات. إنهما متكاملان — طلب واحد يتدفق عبر كليهما — وأسرع طريقة لضبطهما معاً هي مستوى استقلالية. بقية هذه الصفحة للحالات التي تحتاج فيها إلى معرفة أي طبقة تمتلك تهديداً محدداً.
الدور المطلوب. يستطيع أي عضو في مساحة العمل قراءة السياسات وتغذية Matches لحواجز الحماية؛ تغذية Events لجدار الحماية تتطلب دور Developer. إنشاء أو تحرير حواجز الحماية أو سياسات جدار الحماية يتطلب أيضاً Developer أو أعلى.

1. التمييز في جملة واحدة

الطبقةتحكمترى
حواجز الحمايةالنص — ما يقرأه النموذج ويكتبهمحتوى المطالبة، محتوى الاستجابة
جدار الحماية للوكيلالإجراءات — ما يفعله الوكيلاستدعاءات الأدوات، إرسالات MCP، وجهات الشبكة الصادرة
تُطلَق حواجز الحماية قبل الاستدعاء الأعلى (على المطالبة) وبعده (على الاستجابة). يُطلَق جدار الحماية على كل استدعاء أداة يُصدره النموذج أو الوكيل — بصرف النظر عن النموذج أو المزود الذي خدم الجولة.

2. مقارنة جنباً إلى جنب

البُعدحواجز الحمايةجدار الحماية للوكيل
تحكمنص المطالبة ونص استجابة النموذجاستدعاءات الأدوات، إرسالات MCP، وجهات الخروج، تكلفة الوكيل
ترىرسالة المستخدم ومطالبة النظام ورد النموذجاسم الأداة ووسائط الاستدعاء واستدعاءات الأداة التي يُصدرها النموذج والمضيف/IP الصادر
تُربط عبرguardrail_id على مفتاح APIfirewall_policy_id على مفتاح API
أنواع القواعدkeyword، regex، pii، max_chars، external، llm_judge، groundingأنماط glob لاسم الأداة + عبارات الوسائط + نطاق egress + ملكية المهارة
أمثلة التهديداتPII في المطالبات، أسرار API في الاستجابات، jailbreaks، مخرجات خارج الموضوع، سياق مفرط الحجماستدعاء أداة خطير، SSRF، تسريب بيانات، حلقة تكلفة وكيل متهالكة، خادم MCP غير موافق عليه
الأحكام / الإجراءاتblock (HTTP 400 guardrail_blockedmask، flagallow، audit، deny (HTTP 400 firewall_blockedsanitize، pending_approval، cap_cost
متى تُطلَقمرحلة المدخلات: قبل استدعاء النموذج؛ مرحلة المخرجات: بعد رد النموذجعلى كل استدعاء أداة يُصدره النموذج أو الوكيل
وضع الظل / المراقبةلا — حواجز الحماية تُطلَق أو لا تُطلَقنعم — وضع الظل يُخفَّض الأحكام المُطبِّقة إلى audit للطرح الآمن

3. التهديد ← أي طبقة

استخدم هذا الجدول لتوجيه متطلب أمان جديد إلى الضبط الصحيح:
التهديدالعلاج
PII في رسالة مستخدمحواجز الحماية — قاعدة pii على المدخلات (mask / block)
سر في استجابة النموذجحواجز الحماية — قاعدة أسرار على المخرجات
استدعاء أداة خطير (shell.exec rm -rf /)جدار الحمايةdeny على أنماط glob للأداة + عبارة وسائط
SSRF / تسريب بيانات عبر URL صادرجدار الحماية — قائمة سماح/رفض egress
حقن مطالبة من محتوى غير موثوقكلاهما — حاجز مدخلات + قائمة سماح جدار الحماية
سر في وسيطة أداةجدار الحماية sanitize + قاعدة أسرار حواجز الحماية
Jailbreak / تجاوز السياسةحواجز الحمايةllm_judge / keyword / regex
مطالبة مفرطة الحجم أو تكلفة رموزحواجز الحماية — قاعدة max_chars
إنفاق وكيل متهالك (حلقة تكلفة)جدار الحماية — حكم cap_cost
خادم MCP غير موافق عليهجدار الحماية — رفض سطح MCP / pending_approval
بيانات حساسة من نتيجة أداةحواجز الحماية — قاعدة مخرجات على الاستجابة
“لماذا” العميق لكل تزاوج يعيش في صفحات التعمق التهديدات.

4. استخدم كليهما — مستويات الاستقلالية تضبطهما معاً

صُممت حواجز الحماية وجدار الحماية للتركيب، وليس التنافس. طلب واحد يمر عبر كلا المستويين:
  1. يعمل حاجز مدخلات — نص المطالبة يُفحص ويُخفى اختيارياً.
  2. استدعاء النموذج — المطالبة (المُعقَّمة ربما) تصل للنموذج الأعلى.
  3. جدار الحماية — كل استدعاء أداة يُصدره النموذج يُقيَّم.
  4. يعمل حاجز مخرجات — نص استجابة النموذج يُفحص.
أسرع طريقة لضبط كليهما دفعة واحدة هي مستوى استقلالية — إعداد واحد يكتب بشكل ذري سياسة Firewall وسياسة Guardrails لكامل مساحة العمل، مع التراجع بنقرة واحدة:
مستوى الاستقلاليةموقف جدار الحمايةموقف حواجز الحماية
tightحجب افتراضي؛ حجب shell المدمّر + خروج SSRFPII Shield + الأسرار مفعّلة
balancedتدقيق افتراضي؛ رفض shell المدمّرPII Shield بوضع تدقيق فقط (يُعلّم PII)
permissiveلا قواعد مُطبِّقة؛ وضع observe مفعّللا تطبيق
طبّق مستوى استقلالية من وحدة تحكم Firewall (POST /api/workspace/firewall/autonomy، Developer+)، ثم اضبط كل مستوى بشكل مستقل من هناك.

5. الملخص

حواجز الحماية تمتلك النص؛ جدار الحماية يمتلك الإجراءات — شغّل كليهما، دع مستوى الاستقلالية يربطهما معاً، وشدّد كل مستوى بشكل مستقل بمجرد رؤية حركة مرور وكلائك الحقيقية.

حواجز الحماية

أنواع القواعد وكشف PII وLLM judge وإطار التقييم ومرجع API.

جدار الحماية للوكيل

الأحكام والأسطح ومستويات الاستقلالية وموافقة HITL ومرجع API.