/v1/* يصدره ذلك المفتاح — قبل أن يرى النموذج المطالبة وبعد أن يجيب
النموذج — بدون إعادة نشر وبدون تغيير في SDK.
هذه الصفحة هي المحور لقسم حواجز الحماية: ما هو حاجز الحماية، وأنواع
القواعد، والمراحل والإجراءات، وكيف تُربط السياسة بمفتاح. كل صفحة فرعية
تتعمق أكثر. للمرجع الكامل للمحرك، انظر
حواجز الحماية.
1. ما الذي تفعله حواجز حماية الذكاء الاصطناعي على البوابة
معظم الفرق تلجأ إلى حواجز الحماية لإبقاء البيانات الحساسة خارج المطالبات (PII، الأسرار)، أو لتبويب المحتوى غير الآمن (jailbreak، نية حقن المطالبات)، أو لتلبية ضابط امتثال. حاجز الحماية هو جواب البوابة: سياسة مسمّاة ضمن نطاق مساحة العمل — قائمة مرتبة من القواعد تشغّلها البوابة على مدخلات الطلب ومخرجات النموذج. ولأن الربط يعيش على مفتاح API في البوابة — وليس في تطبيقك — فإن تعديل حاجز حماية يحدث أثره على كل مفتاح مرتبط في الاستدعاء التالي. يبقى كودك يستدعي/v1/chat/completions تماماً كما كان.
حواجز الحماية هي سياسة محتوى (نص داخل، نص خارج). الرفيق
جدار الحماية للوكيل هو سياسة أدوات — يحكم
أي استدعاءات أدوات يجوز للوكيل إجراؤها. الاثنان يتكاملان؛ انظر
حواجز الحماية مقابل جدار الحماية.
2. مثال واحد ملموس
أنشئ حاجز حماية باسمpii-shield في وحدة التحكم
(/console/guardrails)، أضف قاعدة PII واحدة — المرحلة input،
الإجراء mask، الكيانات email، ssn — واربطها بمفتاح. من تلك اللحظة:
Reply to [EMAIL] please قبل
إعادة التوجيه — لا يرى النموذج الأعلى العنوان أبداً. اقلب كيان ssn
ذاك إلى block ويُرفض الطلب التالي الذي يحمل SSN بـ HTTP 400. بدون
أي تغيير في التطبيق.
3. القواعد: النوع، المرحلة، الإجراء
كل قاعدة تجيب على ثلاثة أسئلة. يشغّل المحرك كل القواعد المنطبقة ويطويها في قرار واحد.النوع — ماذا تبحث عنه
النوع — ماذا تبحث عنه
سبعة أنواع من القواعد. المدمجة حتمية (مطابقة سلاسل/regex نقية، بدون
شبكة)؛ والمتقدمة تستدعي نموذجاً أو مزوداً وتعمل بالتزامن.
keyword— قائمة حظر حرفية، مطابقة جزئية غير حساسة لحالة الأحرف.regex— نمط RE2 (زمن خطي، بدون مراجع خلفية).pii— كواشف الكيانات المدمجة بالإضافة إلى كياناتك. انظر §5.max_chars— يحدّ عدد الأحرف في مرحلة ما.external— يفوّض إلى مزود متصل (Aporia أو Averta أو webhook خاص بك).llm_judge— فحص دلالي مقابل نموذج في مساحة عملك.grounding— يسجّل مدى أمانة الإجابة مقابل المصادر المسترجعة على الطلب (RAG).
المرحلة — أين تبحث
المرحلة — أين تبحث
input (الطلب)، أو output (استجابة النموذج)، أو both. تعمل قواعد
المدخلات قبل الاستدعاء الأعلى؛ وتعمل قواعد المخرجات بعد أن يستجيب
النموذج. انظر مرحلة المدخلات
ومرحلة المخرجات.الإجراء — ماذا تفعل
الإجراء — ماذا تفعل
خمسة إجراءات تظهر في باني القواعد:
- block — رفض الاستدعاء بـ HTTP 400.
- mask — تنقيح المطابقة وتمرير النص المُنقّى.
- flag — لا تغيّر شيئاً في حركة المرور؛ تسجّل المطابقة فقط.
- annotate — تترك النص كما هو لكنها تحقن ملاحظة أمنية للأعلى (مثل تنبيه CVE قبل أن يجيب النموذج).
- spotlight — تغلّف النص غير الموثوق المطابق بفواصل وتخبر النموذج بمعاملته كبيانات، لا كتعليمات.
4. كيف يُربط حاجز الحماية ويُحَل
يُربط حاجز حماية بمفتاح عبرguardrail_id، أو يمكن لمساحة عمل أن تعلّم
حاجز حماية واحداً كافتراضي لها. لأي طلب تحل البوابة بهذا الترتيب:
- الربط الصريح — إذا كان
guardrail_idللمفتاح يشير إلى حاجز حماية موجود ومفعّل، فإن ذلك ينطبق. الربط الصريح لا يتراجع أبداً: تعطيله هو مفتاح الإيقاف. - افتراضي مساحة العمل — إذا لم يكن للمفتاح ربط، ينطبق حاجز الحماية الافتراضي المفعّل.
- لا هذا ولا ذاك — لا تطبيق؛ الطلب متطابق بايت ببايت مع مساحة عمل لم تفعّل الميزة أبداً.
يختلف هذا عن جدار الحماية. سياسة جدار الحماية المربوطة المعطّلة
تتراجع إلى افتراضي مساحة العمل؛ أما حاجز الحماية المربوط المعطّل
فيؤول إلى لا شيء. مفتاح الإيقاف حرفي لحواجز الحماية.
5. كواشف PII
تشحن قاعدةpii مجموعة مغلقة من الكواشف المدمجة:
email، phone، credit_card، ssn، ip، iban، mac_address،
jwt، aws_access_key، api_key_openai، bitcoin_address — بالإضافة
إلى الكيانات الإقليمية jp_mynumber، kr_rrn، وcn_resident_id.
عند إجراء mask تصبح كل مطابقة وسماً مُصنّفاً — يُصيّر البريد
الإلكتروني [EMAIL]، وSSN [SSN]. يمكنك تركيب حتى 25 كياناً
مخصصاً لكل قاعدة (regex بمجموع تحقّق Luhn اختياري)، وتوجيه كيانات
مختلفة إلى إجراءات مختلفة في قاعدة واحدة عبر تجاوزات لكل كيان.
6. منتقي الإعدادات المسبقة
New guardrail يفتح في قالب. الإعدادات المسبقة مكتوبة من جانب الخادم، لذا تصف وحدة التحكم والـ sandbox وهذه المستندات السلوك نفسه. يجمّعها المنتقي في فئات:| الفئة | إعدادات مسبقة مثال | الصفحة الفرعية |
|---|---|---|
| pii / secrets | PII Shield، حواجز اعتماد الأسرار | حجب الأسرار |
| safety | حقن المطالبات، jailbreak، إيذاء النفس | حقن المطالبات |
| compliance | GDPR، PCI، HIPAA، مُسجّل الامتثال | مُسجّل الامتثال |
| brand / cost | الألفاظ النابية، ذكر المنافسين، سقوف الحجم | سلامة العلامة التجارية · التكلفة |
| agent | مرشحات URL / أداة shell / SQL-في-المخرجات | الوكيل |
| code_security | حجب ملفات الأسرار، مراجعة رخص copyleft | أمان الكود |
7. عندما يحجب حاجز الحماية
الطلب المحجوب يعيد HTTP 400 مع رمز الخطأguardrail_blocked ورسالة
تسمّي حاجز الحماية والقاعدة التي أُطلقت.
- لا تُحاسب أي حصة. حجب مرحلة المدخلات يُطلق قبل القياس؛ وحجب مرحلة المخرجات يردّ الحصة المستهلكة مسبقاً.
- يُعلَّم الطلب بـ skip-retry — إعادة تشغيل نفس المطالبة ستحجب مجدداً فحسب، لذا لن تهدر البوابة إعادة محاولة على قناة أخرى.
8. بعد أن يصبح حياً
تغذية المطابقات
كل قاعدة تُطلق تسجّل النوع والإجراء والمرحلة والتفصيل. جمّع، صفِّ،
صدِّر، وتعمّق في مطابقة واحدة.
التسجيل والخصوصية
السلسلة الفرعية المطابقة تُسجَّل فقط عند تفعيل Log raw content —
مُطفأ افتراضياً، الموقف المحافظ على الخصوصية.
إصدارات
كل تغيير يكتب صف تاريخ. قارن أي إصدارين بـ diff وتراجع كإصدار جديد —
لا يُعدَّل التاريخ أبداً.
الاختبار والتقييم
علامة تبويب Test في الـ sandbox تقيّم السياسة الحالية دون استدعاء
للأعلى، وأداة تقييم تسجّلها مقابل مجموعات مُرفقة أو مخصصة.
9. إلى أين تذهب بعد ذلك
اختر نوع القاعدة الصحيح
اختر نوع القاعدة الصحيح
افهم النموذج
افهم النموذج
اربط بالتهديدات
اربط بالتهديدات
المرجع الكامل للمحرك
المرجع الكامل للمحرك
حواجز الحماية — كل حقل، كل مسار، وقواعد
LLM-judge والترسيخ السياقي، والمزودون الخارجيون بعمق.
