1. حواجز حماية المدخلات لتطبيقات LLM، قبل النموذج
كل قاعدة حاجز حماية تحمل مرحلة —input أو output أو both.
قاعدة input تعمل على نص الطلب لحظة وصوله، في طريقه إلى النموذج الأعلى:
قواعد المدخلات تفحص طلب المستدعي. إذا استخدمت أيضاً
مطالبات السجل، تُضاف رسالة النظام المحقونة لاحقاً
في التوجيه — لذا ترى قواعد المدخلات الرسائل التي أرسلها تطبيقك، لا
المطالبة المحقونة. أما قواعد المخرجات فتفحص الاستجابة في الحالتين.
2. ما يمكنك تشغيله في مرحلة المدخلات
أي نوع قاعدة يمكنه العمل فيinput. أكثر الأسباب شيوعاً لتبويب الطلب
قبل النموذج:
أخفِ PII في المطالبة
قاعدة
pii بإجراء mask تعيد كتابة الكيانات إلى وسوم مُصنّفة
(jane@acme.com → [EMAIL]) بحيث لا يرى النموذج الأعلى القيمة
الخام أبداً. انظر PII Shield.احجب الأسرار قبل أن تتسرب
طلب يحمل مفتاح API أو اعتماد سحابة يُرفض عند الباب — قبل القياس، بلا
استدعاء للأعلى. انظر
حجب الأسرار.
أوقف محاولات الحقن
إعداد أساسيات حقن المطالبات المسبق يقرن كواشف keyword/regex بقاعدة
llm_judge لنية الحقن. انظر
حقن المطالبات.ضع سقفاً لحجم المطالبة
قاعدة
max_chars ترفض مطالبة مفرطة الحجم قبل أن تفوتر أي رموز. انظر
حواجز حماية التكلفة.keyword، regex، pii، max_chars،
external، llm_judge، grounding — والإجراءات الخمسة block،
mask، flag، annotate، وspotlight كلها تنطبق هنا. (spotlight
يغلّف النص غير الموثوق المطابق بفواصل بحيث يعامله النموذج كبيانات، لا
تعليمات — دفاع حقن مطالبات في مرحلة المدخلات؛ وannotate يرفق ملاحظة
دون تغيير حركة المرور.) استثناء واحد جدير بالمعرفة:
grounding يقيس
الإجابة مقابل المصادر المسترجعة، فهو بطبيعته فحص مرحلة مخرجات. كل ما
عداه يناسب مرحلة المدخلات بشكل طبيعي.
3. مثال واحد ملموس
ألّف القاعدة في وحدة التحكم (تحت جلستك — تكوين حاجز الحماية يتطلب Developer+)، وليس بمفتاح ترحيل. أضف قاعدةinput واحدة إلى حاجز
حماية باسم secrets-shield:
guardrail_id، أو علّمه افتراضي مساحة
العمل — انظر اربط بمفتاح)، ثم
استدعِ البوابة بمفتاح الترحيل sk-orca-... ذاك:
guardrail_blocked
قبل أن تعيد البوابة توجيه أي شيء للأعلى:
guardrail_blocked
لشكل الاستجابة الكامل.
4. لماذا حجب المدخلات لا يكلّف أي حصة
هذه هي الميزة البنيوية لاصطياد الأشياء في طريق الدخول. حجب مرحلة المدخلات يجلس قبل الاستهلاك المسبق، لذا:| الخاصية | حجب مرحلة المدخلات |
|---|---|
| حالة HTTP | 400 guardrail_blocked |
| الحصة المحاسَبة | لا شيء — يُطلق قبل القياس |
| الاستدعاء الأعلى | لم يُجرَ أبداً |
| إعادة المحاولة | مُعلَّم skip-retry — إعادة التشغيل تحجب مجدداً |
لأن الطلب لا يصل إلى قناة أبداً، يُعلَّم حجب المدخلات بـ skip-retry:
إعادة تشغيل نفس المطالبة مقابل قناة أخرى ستحجب مجدداً فحسب وتهدر الجهد.
تختلف مرحلة المخرجات — الحجب هناك يردّ الحصة التي استهلكتها البوابة
مسبقاً. نفس
400، محاسبة مختلفة.5. الحل والتراجع
قاعدة مرحلة المدخلات تعمل فقط إذا حُلّ حاجز حماية فعلاً على الطلب. الحل صريح:guardrail_idالصريح للمفتاح، إن كان موجوداً ومفعّلاً.- وإلا حاجز الحماية الافتراضي لمساحة العمل.
- وإلا لا شيء — الطلب متطابق بايت ببايت مع مساحة عمل بلا سياسة.
6. أثبتها قبل أن تشحنها
لا تربط قاعدة مدخلات حاجبة بحركة المرور الحية على الإيمان. طريقتان للتحقق أولاً:علامة التبويب Test — عينة واحدة
علامة التبويب Test — عينة واحدة
افتح علامة التبويب Test في محرر حاجز الحماية، الصق عينة، اختر
مرحلة
input، وشغّل. يقيّم الـ sandbox السياسة الحالية محلياً —
بدون استدعاء للأعلى، بدون حصة — ويعيد الحكم بالإضافة إلى (لقواعد
mask) النص المُصيَّر. انظر
الاختبار والتقييم.علّم قبل أن تحجب
علّم قبل أن تحجب
اضبط الإجراء على flag أولاً. التعليم لا يغيّر شيئاً في حركة
المرور — يسجّل مطابقة فقط — بحيث يمكنك قياس كم مرة ستُطلق قاعدة على
مدخلات حقيقية قبل أن تقلبها إلى block. انظر
ضبط الإيجابيات الكاذبة.
انظر ما أُطلق
انظر ما أُطلق
كل قاعدة تُطلق تسجّل مطابقة — النوع والإجراء والمرحلة وسلسلة تفصيل.
السلسلة الفرعية المطابقة تُسجَّل فقط عند تفعيل Log raw content
(مُطفأ افتراضياً). انظر
تغذية المطابقات و
التسجيل والخصوصية.
7. إلى أين تذهب بعد ذلك
مرحلة المدخلات تمنع المدخلات السيئة من الوصول إلى النموذج. لتبويب استجابة النموذج، اقرنها بمرحلة المخرجات؛ ولحكم استدعاءات أدوات وكيل، استخدم جدار الحماية.- قواعد مرحلة المخرجات — افحص استجابة النموذج بعد عودتها.
- المراحل و
both— متى تشغّل قاعدة على المدخلات أو المخرجات أو كليهما. - تأمين وكلاء الذكاء الاصطناعي — أين تجلس حواجز حماية المدخلات في مجموعة التحكم الكاملة.
- تهديد حقن المطالبات و تسريب البيانات — الهجمات التي بُنيت قاعدة المدخلات لإيقافها.
