sanitize في جدار الحماية فعلاً، وما لا ينقّحه، وأي
ضابط يحوكم المحتوى الذي تعيده أداة.
1. ماذا يعني “sanitize” على سطح mcp
عندما يستدعي وكيل أداة عبر بوابة MCP، يُقيَّم كلtools/call على سطح mcp قبل الإرسال. يمكن لـ
قاعدة مطابقة أن تحمل أحد أحكام جدار
الحماية القابلة للتأليف — allow، أو audit، أو deny، أو sanitize،
أو pending_approval، أو cap_cost. حكم sanitize هو المنقِّح:
- يشغّل مجموعة من كواشف أشكال الأسرار على وسائط الاستدعاء (الـ JSON الذي مرّره النموذج إلى الأداة).
- يُستبدَل كل تطابق برمز قانوني مثل
[redacted:openai_key]، والوسائط المُعاد كتابتها هي ما يُمرَّر إلى الخادم. - لا تزال الأداة تعمل —
sanitizeحكم غير حاجب ومُمرِّر. لا ينهار الوكيل؛ هو فقط لا يسلّم السرّ الخام إلى الأداة أبداً.
sk-، ورموز Bearer، ورقم الضمان الاجتماعي الأمريكي، وأرقام
بطاقات صحيحة Luhn، والبريد الإلكتروني)، ويمكن لقاعدة إضافة تعبيرات نمطية
مخصّصة تُعرَض تطابقاتها كـ[redacted:custom].
على السطح inbound —
tools[] المُعلَنة التي يُصرّح بها طلب، قبل
استدعاء أي أداة — لا توجد وسائط وقت استدعاء لتنقيحها، فحكم sanitize
هناك يفشل مغلقاً ويُصعَّد إلى deny. sanitize ذو معنى فقط حيث توجد
حمولة وسيط حية لإعادة كتابتها: سطحا mcp وresponse.2. قاعدة ملموسة واحدة
لنقل إنك تريد أن يُمرَّر أي استدعاء أداة تحتوي وسائطه مفتاحاً بنمط OpenAI مع تنظيف المفتاح، بدلاً من حجبه. ألّف قاعدة على سطح mcp بحكمsanitize، مُكوَّنة لكشف ذلك الشكل من الأسرار. افعل هذا من وحدة
التحكم (Firewall → السياسة → القواعد)؛ تتطلب الكتابة Developer+.
القاعدة، مفاهيمياً:
| الحقل | القيمة |
|---|---|
| السطح | mcp |
tool_name_glob | * (أو حدّد نطاق خادم واحد، مثل github.*) |
| الحكم | sanitize |
| مُعَدّات التنظيف | كواشف الأسرار المطلوب تفعيلها |
sanitize، والسطح، والقاعدة المطابقة.
3. نتائج الأدوات غير موثوقة — حوكمها على رد النموذج
هنا الجزء الذي تخطئ فيه معظم إعدادات “تنظيف المخرجات”. حكمsanitize
يلمس الوسائط فقط. نتيجة أداة — النص أو الـ JSON الذي يعيده خادم
MCP — لا يُعاد كتابتها أبداً بحكم جدار حماية.
يعامل OrcaRouter محتوى نتيجة الأداة كـإدخال غير موثوق إلى النموذج.
خادم MCP مخترَق أو مسمَّم يمكنه إعادة سرّ، أو سجل PII، أو حمولة حقن
مطالبة متنكّرة كبيانات. الضابط لذلك المحتوى هو
حاجز حماية على مرحلة المخرجات — رد
النموذج، مُقيَّماً بعد أن يكون النموذج قد ضمّ نتيجة الأداة.
امسك الأسرار التي تظهر في الرد
امسك الأسرار التي تظهر في الرد
أرفِق حاجز حماية بمُعَدّ Secrets & API-Key Blocker (الفئة
secrets). يحجب اعتمادات بنمط AWS / OpenAI / GitHub؛ اقرنه بـ
Private Keys & Cloud Tokens لمفاتيح PEM، ورموز Slack/Stripe،
ومفاتيح Google، وJWT. حجب مرحلة المخرجات يعيد
guardrail_blocked (HTTP 400) ويردّ حصة الطلب.نقّح PII في الرد
نقّح PII في الرد
مُعَدّ PII Shield يقنّع الكيانات المصنّفة —
[EMAIL]، و[SSN]،
و[CREDIT_CARD]، … — مُعرِضاً القيم المطابقة كوسوم. تقنيع مرحلة
المُدخَلات حيّ على كل طلب (تدفّقي أو لا): يقنّع الطلب قبل أن يراه
النموذج. تقنيع مرحلة المخرجات يعيد كتابة رد النموذج على
الاستجابات غير التدفّقية فقط؛ وإعادة الكتابة داخل النطاق لرد
تدفّقي في خارطة الطريق، فقاعدة تقنيع لا تنقّح بعد رداً متدفّقاً.عطّل الحقن الراكب في نتائج الأدوات
عطّل الحقن الراكب في نتائج الأدوات
النتيجة المسمَّمة يمكن أن تحمل نصاً بنمط “تجاهل التعليمات السابقة”.
مُعَدّ السلامة Prompt-Injection Basics (كلمة مفتاحية/تعبير نمطي)
إضافة إلى قاعدة
llm_judge تسجّل نية الحقن هما الضابطان هنا.
انظر تسميم أدوات MCP و
حقن المطالبة.فرض المخرجات والتدفّق. حجب مرحلة المخرجات مفروض على كل من
الردود التدفّقية وغير التدفّقية — على تدفّق، يقطع الحجب التدفّق عند
تطابقه ويبعث إشعار حجب عاماً. تقنيع مرحلة المخرجات ينطبق على الردود
غير التدفّقية فقط؛ وإعادة الكتابة داخل النطاق لرد تدفّقي في خارطة
الطريق، فقاعدة تقنيع لا تنقّح بعد رداً متدفّقاً.
4. أين يعيش كل ضابط
خريطة مدمجة للسطحين، بحيث توصّل المقبض الصحيح بالمخاطرة الصحيحة:| تريد حوكمة… | الضابط | أين |
|---|---|---|
| الأسرار في وسائط استدعاء أداة | حكم sanitize في جدار الحماية (سطح mcp) | قواعد جدار الحماية |
| الأسرار / PII / الحقن في نتيجة أداة | حاجز حماية على مرحلة المخرجات | حواجز الحماية |
5. الإرفاق والمراقبة
كلا الضابطين ضمن نطاق مساحة العمل، ومسمّيان، ومرتّبان، وكلاهما يُرفَق بالطريقتين نفسيهما:- لكل مفتاح — اضبط
firewall_policy_id(لقاعدة sanitize) وguardrail_id(لسياسة المخرجات) على المفتاح الذي يستخدمه الوكيل. - افتراضي مساحة العمل — علّم سياسة / حاجز حماية كافتراضي مساحة العمل بحيث يرثه كل مفتاح.
6. إلى أين تذهب بعد ذلك
قائمة سماح أدوات MCP
امنع خادماً افتراضياً واسمح فقط بالأدوات التي راجعتها.
قواعد جدار الحماية
لغة القواعد الكاملة — الأحكام، والـ globs، وargs-match، وتكوين sanitize.
حواجز الحماية
سياسات المحتوى، والمُعَدّات، وكيانات PII، وفرض مرحلة المخرجات.
تسميم أدوات MCP
التهديد الذي يجعل نتائج الأدوات غير موثوقة أصلاً.
