deny أو sanitize أو [EMAIL]. هذه الصفحة هي جدول البحث
لتلك الكلمات: ماذا تعني كلٌّ منها، وماذا تفعل بالاستدعاء، وأين تذهب
للآليات الكاملة. أبقها مفتوحة بينما تؤلّف القواعد أو تفرز تغذية الأحداث.
مستويا تحكّم ينتجان مفردتين. يحكم جدار الحماية
إجراءات الأدوات ويصدر حكماً. تفحص حواجز الحماية
نص المطالبة والاستجابة وتصدر إجراءً بالإضافة إلى، على إخفاء، وسم
إخفاء مُصنّف. لا تتشاركان كلمة أبداً — حاجز الحماية لا يقول deny أبداً،
وجدار الحماية لا يقول mask أبداً.
هذا فهرس مرجعي، لا دليل كيفية. لحالة الاستخدام خلف كل تحكّم انظر
حواجز الحماية مقابل جدار الحماية؛
ولأجسام HTTP انظر رموز أخطاء الأمان.
1. مسرد أحكام جدار الحماية
تحلّ قاعدة جدار حماية (أوdefault_verdict للسياسة) كل استدعاء أداة إلى
أحد هذه الأحكام الستة بالضبط. يجتاز المحرك القواعد بترتيب الأولوية،
أول مطابقة تفوز، ويتراجع إلى الافتراضي إذا لم يطابق شيء.
allow — مرّر الاستدعاء
allow — مرّر الاستدعاء
يمضي الاستدعاء إلى الأداة. لا يزال يُسجَّل كحدث جدار حماية فيظهر في
Runs وتغذية الأحداث. هذا ما تريده للأدوات التي يُوثَق بالوكيل صراحةً
لاستخدامها.
audit — اسمح، لكن سجّله للمراجعة
audit — اسمح، لكن سجّله للمراجعة
حركة مرور مطابقة لـ
allow، لكن مُعلَّمة كشيء أردت مراقبته.
إنه default_verdict الموصى به: راقب كل شيء، احجب لا شيء،
حتى تُضبط قواعدك. مستوى الاستقلالية balanced يشحن حاجز حماية PII
Shield كعلامة فقط (audit)، فتُسجَّل PII دون تعليق الاستدعاء.deny — احجب الاستدعاء
deny — احجب الاستدعاء
لا يصل الاستدعاء إلى الأداة أبداً. على سطح
inbound يعيد هذا
HTTP 400 firewall_blocked؛ وعبر بوابة MCP يعود كـخطأ أداة
(firewall deny: <reason>) فيستطيع النموذج التفاعل بدلاً من الانهيار.
معلَّم skip-retry. لا يكلّف رموز نموذج.sanitize — نقّح الوسائط، مرّر الاستدعاء المنظَّف
sanitize — نقّح الوسائط، مرّر الاستدعاء المنظَّف
يستبدل السلاسل الفرعية المطابقة (الأسرار، PII) في وسائط استدعاء
الأداة برمز
[redacted:<preset>]، ثم يمرّر الاستدعاء بالوسائط
المنظَّفة. ينقّح الوسائط فقط — لا المحتوى الذي تعيده أداة.
على سطح inbound، حيث
لا توجد بعد وسائط وقت الاستدعاء، يتصاعد sanitize إلى deny.pending_approval — علّق لإنسان
pending_approval — علّق لإنسان
يُدرَج الاستدعاء في طابور المراجعة ويحصل الوكيل على استجابة مُعلَّقة
تحمل معرّف موافقة (HTTP 400
firewall_approval_pending). يحلّها
مراجِع في وحدة التحكم أو عبر استدعاء webhook راجع مُوقَّع بـ HMAC؛
يستطلع الوكيل المعرّف ويعيد التقديم مرة بترويسة موافقة أحادية الاستخدام.
انظر الموافقة البشرية.cap_cost — احجب بمجرد أن يتجاوز التشغيل الإنفاق
cap_cost — احجب بمجرد أن يتجاوز التشغيل الإنفاق
مؤلَّف كقاعدة بسقف سنتات لكل قاعدة. يُحَل إلى
allow
بينما يكون تشغيل الوكيل تحت الميزانية وإلى deny بمجرد أن يتجاوز
الإنفاق المتراكم السقف — فيُظهر حدث allow أو deny، لا الكلمة
الحرفية cap_cost. قاطع دائرة لحلقات الانفلات.الحكم الافتراضي
default_verdict يقبل الأحكام الثلاثة غير التفاعلية فقط:
| القيمة | المعنى عندما لا تطابق أي قاعدة |
|---|---|
allow | اسمح باستدعاءات الأدوات غير المغطّاة صامتاً. |
audit | اسمح لكن سجّل — الافتراضي. |
deny | احجب أي شيء لا تسمح به قاعدة صراحةً (موقف الحجب الافتراضي). |
tight يضبط default_verdict: deny؛ وbalanced
والافتراضي المشحون يستخدمان audit.
2. إجراءات حاجز الحماية
تطلق قاعدة حاجز حماية أحد خمسة إجراءات. إنها مكافئ مستوى النص للأحكام — وقاعدة حاجز حماية لا تنتج حكم جدار حماية أبداً.| الإجراء | ماذا يفعل | الحصة |
|---|---|---|
block | ارفض الطلب كله بـ HTTP 400 guardrail_blocked. | لا شيء — حجب الإدخال يُطلق قبل القياس؛ وحجب الإخراج يُرجِع. |
mask | نقّح كل تطابق إلى وسم مُصنّف (انظر §3) ومرّر النص المنظَّف. | عادية — يمضي الاستدعاء. |
flag | سجّل فقط. يسجّل تطابقاً؛ لا يغيّر شيئاً في حركة المرور. | عادية. |
annotate | غير حاجب. يرفق ملاحظة قابلة للقراءة البشرية بالطلب (مُحقونة للأعلى كإشعار أمني) دون إخفاء النص أو حجبه. | عادية. |
spotlight | غير حاجب. يلفّ النص (غير الموثوق) المطابق بمحدّدات ويخبر النموذج بمعاملة المنطقة المحدَّدة كبيانات، لا تعليمات أبداً — دفاع “spotlighting” ضد حقن المطالبة. | عادية. |
pii واحدة تطبيق إجراءات مختلفة على كيانات مختلفة بـ
entity_actions — أخفِ البريد والهواتف، لكن احجب على credit_card
وssn، من قاعدة واحدة. يجب أن تكون المفاتيح كياناً مفعّلاً على القاعدة؛
ويجب أن تكون القيم block / mask / flag / annotate.
3. مسرد وسوم الإخفاء
على إجراءmask، يُستبدل كل كيان مطابق في النطاق بوسم مُصنّف —
[<UPPERCASE_ENTITY_NAME>] — حتى يرى النموذج (مرحلة الإدخال) أو المستدعي
(مرحلة الإخراج) شكل البيانات دون القيمة. يعمل الإخفاء على كلتا المرحلتين،
متضمناً الاستجابات المتدفّقة: ماسح بثّ مدرك للرموز يخفي التطابقات التي
تتخطّى حدود المقاطع قبل أن تصل إلى العميل.
| الكيان | الوسم |
|---|---|
email | [EMAIL] |
phone | [PHONE] |
credit_card | [CREDIT_CARD] |
ssn | [SSN] |
ip | [IP] |
iban | [IBAN] |
mac_address | [MAC_ADDRESS] |
jwt | [JWT] |
aws_access_key | [AWS_ACCESS_KEY] |
api_key_openai | [API_KEY_OPENAI] |
bitcoin_address | [BITCOIN_ADDRESS] |
| الكيان | الوسم | المنطقة |
|---|---|---|
jp_mynumber | [JP_MYNUMBER] | اليابان |
kr_rrn | [KR_RRN] | كوريا الجنوبية |
cn_resident_id | [CN_RESIDENT_ID] | الصين |
الكيانات المخصّصة تتبع نفس العُرف. كيان مخصّص اسمه
employee_id يُخفى إلى [EMPLOYEE_ID] ما لم تضبط بديل mask_with صريحاً.
حتى 25 كياناً مخصّصاً لكل قاعدة، كلٌّ منها regex بنمط RE2 مع مجموع تحقّق
luhn اختياري. انظر كشف PII.4. مثال واحد مُعالَج
استدعاء أداةdb.query واحد، يُقرأ من أعلى لأسفل، يلمس كلتا المفردتين:
sanitize جدار الحماية وسائط الأداة؛ ونظّف mask حاجز الحماية
نص المطالبة؛ ووسم [EMAIL] هو ما يراه النموذج بدلاً من العنوان. نفس
الطلب، ثلاث طبقات مختلفة، ثلاث كلمات من هذا المسرد.
5. كلمات الموقف التي ستراها إلى جانب الأحكام
هذه ليست أحكاماً أو إجراءات، لكنها تقرّر ما إذا كان حكم يُفرض أصلاً — فتظهر في نفس عروض الأحداث والإعدادات.| الكلمة | المستوى | المعنى |
|---|---|---|
| Shadow mode | جدار الحماية | علامة لكل سياسة. تخفّض كل حكم فارض إلى audit، وتُسبق السبب بـ [shadow] would …. |
| Observe mode | جدار الحماية | إعداد مساحة العمل. عندما لا تُحَل أي سياسة، يسمح بالاستدعاء لكنه يسجّله كثغرة تغطية (الأدوات المكتشفة). |
| Enforce | جدار الحماية | الظل مطفأ + سياسة مرتبطة: تأخذ الأحكام أثرها. |
| Fail-open | حواجز الحماية | الافتراضي للقواعد المتقدّمة (llm_judge، grounding، external) — يُرصَد انتهاء المهلة، ويستمر الطلب. اقلب إلى fail-closed لكل قاعدة. |
| Log raw content | حواجز الحماية | مطفأ افتراضياً. عند إطفائه، يسجّل تطابق أن قاعدة أُطلقت لكن ليس السلسلة الفرعية المطابقة. |
6. أين تُعرَّف كل كلمة
| السطح | المفردات | الصفحة الأم |
|---|---|---|
| سياسة جدار الحماية | allow audit deny sanitize pending_approval cap_cost | جدار الحماية |
| مطابقة قاعدة جدار الحماية | tool_name_glob، args_match، egress، sequence | قواعد جدار الحماية |
| قاعدة حاجز الحماية | block mask flag annotate spotlight | حواجز الحماية |
| PII حاجز الحماية | أسماء الكيانات + وسوم الإخفاء | حواجز الحماية |
| MCP والمهارات | نطاقات مخاطر المهارة، وضعا quarantine / block | Firewall MCP، مهارات جدار الحماية |
| أجسام أخطاء HTTP | guardrail_blocked، firewall_blocked، firewall_approval_pending | رموز الأخطاء |
7. قراءة ذات صلة
لماذا حُجب هذا؟
تتبّع استدعاءً مرفوضاً واحداً إلى القاعدة والحكم الدقيق الذي أوقفه.
أوضاع الفرض
كيف يترابط audit والظل والمراقبة والفرض — وكيف تطرح بأمان.
حواجز الحماية مقابل جدار الحماية
أي مستوى يملك أي قرار، ولماذا يمكن لطلب المرور عبر كليهما.
استدعاءات الأدوات الخطرة
التهديد الذي يوجد حكما
deny وsanitize لإيقافه.