الانتقال إلى المحتوى الرئيسي
بمجرد أن يكون لديك مساحة عمل ومفتاح API (انظر المقدمة)، فإن حواجز الحماية هي الطريقة التي تضع بها سياسة محتوى أمام كل نموذج. هذه الصفحة هي المرجع الكنسي لمحرك حواجز الحماية في OrcaRouter — ما هو، وكيفية استخدامه، وكيف يتكامل مع بقية البوابة.

1. ما هو محرك حواجز الحماية

حاجز الحماية هو سياسة محتوى مسمّاة ضمن نطاق مساحة العمل — قائمة مرتبة من القواعد تشغّلها البوابة على مدخلات الطلب ومخرجات النموذج. تحفظ حاجز حماية مرة واحدة، وتربط أي مفتاح API به (أو تضبط واحداً كافتراضي لمساحة العمل)، وتقوم البوابة بفحص كل استدعاء قبل النموذج الأعلى وبعده. كل قاعدة تقرر شيئاً واحداً — ماذا تبحث عنه (نوع القاعدة)، وأين تبحث (مرحلة: مدخلات الطلب أو مخرجات النموذج)، وماذا تفعل حيال ذلك (إجراء: block أو mask أو flag). يشغّل المحرك كل قاعدة منطبقة ويطوي النتائج في قرار واحد. تعديل حاجز الحماية يحدث أثره على كل مفتاح مرتبط به في الاستدعاء التالي. بدون إعادة نشر. بدون تغيير في الكود. بدون ترقية SDK. السياسة تعيش في البوابة، وليس في تطبيقك — يبقى تطبيقك يستدعي /v1/chat/completions تماماً كما كان. المحرك حتمي وخالٍ من التبعيات للأنواع المدمجة من القواعد: مطابقة سلاسل وregex نقية بدون أي استدعاء شبكي، آمنة للتشغيل على مسار الترحيل الساخن. القواعد المتقدمة (المزودون الخارجيون، LLM judge، الترسيخ السياقي) تستدعي خارجياً وتُرسَل بالتزامن بحيث لا يتسلسل فحص بطيء خلف آخر أبداً. حواجز الحماية ضمن نطاق مساحة العمل — كل عضو يرى حواجز حماية مساحة عمله؛ لا شيء يعبر حدود المستأجر.

2. البداية السريعة — افحص طلبك الأول في 5 خطوات

1

أنشئ حاجز حماية

في وحدة التحكم، انتقل إلى /console/guardrails وانقر New guardrail. سمّه pii-shield. أضف قاعدة واحدة:
  • النوع: كشف PII
  • المرحلة: Input (الطلب)
  • الإجراء: Mask — تنقيح المطابقة
  • الكيانات: email، phone، ssn
احفظ.
2

اختبره في الـ sandbox

افتح علامة التبويب Test داخل المحرر، الصق “email me at jane@acme.com، اختر مرحلة input، وشغّل. يُظهر الـ sandbox الحكم والنص المُصيَّر — email me at [EMAIL] — دون إرسال أي شيء للأعلى.
3

اربط مفتاحاً

اذهب إلى /console/token، أنشئ أو حرّر مفتاح API، واختر pii-shield من قائمة Guardrail المنسدلة. يعيش الربط على المفتاح في البوابة.
4

أرسل طلباً

باستخدام ذلك المفتاح، استدعِ OrcaRouter تماماً كما كان من قبل:
curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "Reply to jane@acme.com please"}
    ]
  }'
تُخفي البوابة البريد الإلكتروني إلى [EMAIL] قبل إعادة التوجيه. لا يرى النموذج الأعلى العنوان أبداً.
5

شدّد السياسة

عد إلى /console/guardrails، حرّر pii-shield — غيّر الإجراء على ssn إلى Block عبر تجاوز لكل كيان. احفظ. أول طلب لاحق يحتوي على SSN يُرفض بـ HTTP 400 guardrail_blocked. بدون أي تغيير في التطبيق.
تلك هي القيمة الرئيسية.

3. المفاهيم: حواجز الحماية، القواعد، المراحل، الإجراءات

المفهومالتعريف
Guardrailسياسة مسمّاة ضمن نطاق مساحة العمل. المعرّف: name (≤ 64 حرفاً). لها enabled وis_default وكتلة rules بصيغة JSON.
Ruleفحص واحد داخل سياسة: type وstage وaction، بالإضافة إلى حقول خاصة بالنوع. تعمل القواعد بالترتيب.
Stageinput (الطلب)، أو output (استجابة النموذج)، أو both.
Actionblock (رفض الاستدعاء)، أو mask (تنقيح المطابقة)، أو flag (تسجيل فقط — مراقبة دون تغيير حركة المرور).

النطاق والافتراضي لمساحة العمل

حواجز الحماية ضمن نطاق مطابق تماماً لمفاتيح API: مشتركة على مستوى مساحة العمل عندما يكون لديك مساحة عمل نشطة، ولكل مستخدم خلاف ذلك. الحل لأي طلب:
  1. ربط المفتاح — إذا كان للمفتاح guardrail_id صريح، فإن ذلك الحاجز ينطبق (عندما يكون موجوداً ومفعّلاً). الربط الصريح لا يتراجع صامتاً أبداً؛ تعطيله هو مفتاح الإيقاف.
  2. افتراضي مساحة العمل — إذا لم يكن للمفتاح ربط، ينطبق حاجز is_default المفعّل لمساحة العمل.
  3. لا هذا ولا ذاك — لا تطبيق. الطلب متطابق بايت ببايت مع مساحة عمل لم تفعّل الميزة أبداً.
يمكن لحاجز حماية واحد على الأكثر لكل مساحة عمل أن يكون الافتراضي. ترقية افتراضي جديد يُنزّل القديم في نفس المعاملة.
Fail-open بالتصميم. إذا واجه حل حاجز الحماية خطأً عابراً (مثل عطل مؤقت في قاعدة البيانات)، تتدهور البوابة إلى لا تطبيق بدلاً من إسقاط حركة المرور. تتدهور السلامة؛ ويُحفظ التوفّر.

كيف يبدو الحجب

الطلب المحجوب يعيد HTTP 400 مع رمز الخطأ guardrail_blocked ورسالة تسمّي حاجز الحماية والقاعدة التي أُطلقت. الطلب المحجوب لا يكلّفك أي حصة — حجب مرحلة input يُطلق قبل قياس الاستخدام، وحجب مرحلة output يردّ الحصة المستهلكة مسبقاً — ويُعلَّم بـ skip-retry (إعادة تشغيل نفس المطالبة ستحجب مجدداً فحسب).

4. أنواع القواعد

تقع القواعد في مجموعتين: مدمجة (حتمية، بدون شبكة) ومتقدمة (تستدعي نموذجاً أو مزوداً خارجياً).
النوعالمجموعةماذا تفعل
قائمة حظر الكلمات المفتاحية (keyword)مدمجةتطابق أياً من قائمة من المصطلحات الحرفية — غير حساسة لحالة الأحرف، ومطابقة جزئية (بحيث يطابق class أيضاً classic).
التعبير النمطي (regex)مدمجةيطابق نمط RE2 (زمن خطي، بدون مراجع خلفية).
كشف PII (pii)مدمجةيكشف أنواع الكيانات المدمجة (وكياناتك المخصصة). انظر §5.
الطول الأقصى (max_chars)مدمجةيحدّ عدد أحرف النص في مرحلة ما.
مزود خارجي (external)متقدمةيفوّض الفحص إلى مزود متصل (Aporia، Averta، BYO-webhook، …). انظر §9.
LLM judge (llm_judge)متقدمةيشغّل فحصاً دلالياً مقابل نموذج في مساحة عملك. انظر §6.
الترسيخ السياقي (grounding)متقدمةيسجّل مدى أمانة الإجابة مقابل المصادر المسترجعة على الطلب (RAG). انظر §7.
يمزج حاجز الحماية أي عدد من القواعد من أي أنواع. القواعد المتقدمة (external، llm_judge، grounding) تُرسَل بالتزامن بحيث لا يتسلسل فحص بطيء خلف آخر.

5. كشف PII بالتفصيل

قاعدة pii تكشف الكيانات الحساسة وتطبّق إجراء القاعدة على كل مطابقة. مجموعة الكواشف المدمجة مغلقة ومشتركة بين المحرك، والمدقق، وباني القواعد: email، phone، credit_card، ssn، ip، iban، mac_address، api_key_openai، aws_access_key، jwt، bitcoin_address. عند إجراء mask، تُستبدل كل مطابقة بوسم مُصنّف — يصبح البريد الإلكتروني [EMAIL]، ويصبح SSN [SSN]، وهكذا.

الكيانات المخصصة

أضف طبقة كواشفك الخاصة فوق المجموعة المدمجة. الكيان المخصص هو:
  • name — أحرف ASCII صغيرة / أرقام / شرطة سفلية، يجب أن يبدأ بحرف (مثل employee_id). يتدفق إلى سجلات التدقيق والقياس عن بُعد دون اقتباس.
  • pattern — تعبير Go RE2 النمطي (زمن خطي، بدون مراجع خلفية).
  • checksum — اختياري؛ luhn يتحقق من المطابقة بخوارزمية Luhn (مثلاً للأرقام الشبيهة بالبطاقات).
  • mask_with — استبدال حرفي اختياري؛ الافتراضي [<UPPERCASE_NAME>].
حتى 25 كياناً مخصصاً لكل قاعدة (كل منها مسح regex على كامل النص، فالسقف يبقي المسار الساخن خطياً). الأنماط المُجمَّعة تُخزَّن مؤقتاً عبر الطلبات.

تجاوزات الإجراء لكل كيان

قاعدة PII واحدة يمكنها تطبيق إجراءات مختلفة على كيانات مختلفة عبر entity_actions. قاعدة واحدة تُخفي emails / phones / IPs افتراضياً لكنها تحجب على credit_card أو ssn — بدلاً من ثلاث قواعد متداخلة:
{
  "type": "pii",
  "stage": "input",
  "action": "mask",
  "entities": ["email", "phone", "ip", "credit_card", "ssn"],
  "entity_actions": {
    "credit_card": "block",
    "ssn": "block"
  }
}
يجب أن تكون المفاتيح كياناً مفعّلاً على القاعدة؛ ويجب أن تكون القيم block / mask / flag. يرفض المدقق أي شيء آخر.

6. LLM judge

قاعدة llm_judge تشغّل فحصاً دلالياً مقابل نموذج تستطيع مساحة عملك استدعاءه أصلاً. استخدمها للسياسات الضبابية التي لا يلتقطها أي regex — السُّمية، التحرش، الخروج عن الموضوع، نية حقن المطالبات.
الحقلالمعنى
judge_modelالنموذج أو اسم موجه مستعار للتقييم به (مثل gpt-4o-mini، orcarouter/cheap). يُحَل مقابل قنوات مساحة عملك.
judge_rubricرسالة النظام التي تصف ما يجب تعليمه.
judge_formatإحدى القيم yes_no أو score أو category (مطلوب؛ تختار وحدة التحكم yes_no مسبقًا).
judge_thresholdلـ score: احجب/علّم عندما تكون الدرجة عند هذه القيمة أو أعلى.
judge_categoriesلـ category: القائمة المرفوضة.
judge_timeout_msيحدّ استدعاء الـ judge. 0 ← افتراضي المحرك.
judge_fail_opentrue (الافتراضي) ← خطأ الـ judge يُلاحَظ لكن الطلب يستمر؛ false ← عامل الخطأ/المهلة كحجب.
استدعاء الـ judge يمر عبر قنوات مساحة عملك، لذا تُفوتر رموزه وتُنسب كأي استدعاء آخر (كسطر فرعي للـ judge). يُلحق المحرك ملحق JSON-schema بمعيارك بحيث يعيد النموذج مخرجات قابلة للتحليل.

7. الترسيخ السياقي

قاعدة grounding تقيس إجابة المساعد مقابل المصادر المسترجعة على الطلب (سياق RAG الخاص بك) وتعلّم أو تحجب الإجابات غير الأمينة لها. تعيد استخدام وصلة الـ judge — نفس قنوات مساحة العمل، نفس نسب التكلفة.
الحقلالافتراضيالمعنى
grounding_modelاختيار مساحة العملالنموذج الذي يحل إليه المشغّل فحص الأمانة.
grounding_rubricمدمجيتجاوز معيار الأمانة الافتراضي.
grounding_threshold0.7أرضية الأمانة، 0.01.0. تحتها، يُطلق الإجراء.
grounding_strictfalseعندما يكون true، تُعامَل “no sources provided” كحجب (مقابل السماح الافتراضي).
grounding_max_bytes100000يحدّ سياق المصدر المُسلسل المُسلَّم للـ judge.
grounding_timeout_ms3000يحدّ استدعاء الـ judge.

8. القوالب، الـ sandbox، وأداة التقييم

مكتبة القوالب

زر New guardrail المنقسم يفتح مباشرة في قالب، والمكتبة الكاملة على بُعد نقرة واحدة. الإعدادات المسبقة مكتوبة من جانب الخادم بحيث تصف وحدة التحكم، والـ sandbox، وهذه المستندات السلوك نفسه بالضبط. تشمل الفئات:
  • PII (pii) — PII Shield، PII Blocker (صارم)، Contact-Info Redactor، response PII redactor.
  • الأسرار (secrets) — حواجز اعتماد AWS / OpenAI / GitHub، المفاتيح الخاصة ورموز السحابة، محافظ العملات المشفرة، الأسرار في المُخرجات.
  • الامتثال (compliance) — GDPR (PII الاتحاد الأوروبي)، PCI (حجب كامل للبطاقات)، HIPAA (PHI)، البيانات المالية، مُسجّل الامتثال، فرض إخلاء المسؤولية القانوني.
  • العلامة التجارية (brand) — الألفاظ النابية (block / mask / متعدد اللغات)، ذكر المنافسين، كلمات سلامة الأطفال المفتاحية.
  • الأمان (safety) — حقن المطالبات، jailbreak، تسريب رسالة النظام، إيذاء النفس.
  • التكلفة (cost) — سقوف حجم المطالبة/الاستجابة وسقوف الرموز.
  • الوكيل (agent) — مرشحات URL، صور markdown، استدعاء أدوات shell، وحقن SQL في المُخرجات.
طبّق إعداداً مسبقاً كنقطة انطلاق، ثم حرّر بحرية — الإعداد المسبق بذرة، وليس قفلاً.

الـ sandbox الاختباري

لكل محرر علامة تبويب Test. الصق عينة، اختر مرحلة، وشغّل السياسة الحالية محلياً — بدون استدعاء للأعلى، بدون حصة. يعيد الـ sandbox الحكم و(لقواعد mask) النص المُصيَّر، حتى تثبت أن قاعدة تفعل ما تتوقعه قبل ربط مفتاح.

أداة التقييم / الفريق الأحمر

علامة التبويب Eval تشغّل حاجز حماية مقابل مجموعة من المدخلات وتُبلّغ عن نتيجته — مفيدة لضبط معيار judge أو إثبات أن سياسة تلتقط هجمات معروفة قبل أن تشحنها.
  • المجموعات المُرفقة تأتي مع البوابة — مجموعات عدائية وفريق أحمر (مطالبات سلوك ضار، حقن أدوات، فريق أحمر متعدد اللغات) بالإضافة إلى مجموعات حميدة لقياس الإيجابيات الكاذبة.
  • المجموعات المخصصة — ارفع JSONL الخاص بك للاختبار مقابل أشكال حركة المرور الحقيقية لديك.
  • التشغيلات مدرجة مع نتائجها؛ افتح تشغيلاً لفحص حالات الفشل عينة بعينة.

9. المزودون الخارجيون

قاعدة external تفوّض الفحص إلى مزود متصل. اتصل بمزود مرة واحدة تحت Integrations (زر الدعوة للإجراء في رأس صفحة Guardrails)، ثم أشِر إلى الاتصال من قاعدة.

المزودون المدعومون

المزودما هو
Aporia Guardrails (aporia)محرك سياسات قائم على مجموعة SLM للمطالبات والاستجابات.
Averta (averta)نقطة نهاية مصنِّف SLM عامة (POST نص ← آمن / غير آمن + إعادة صياغة اختيارية).
BYO Webhook (webhook)URL خاص بك — يستقبل المطالبات ويعيد أحكام سماح / حجب / إخفاء / تعليم.
يأخذ Aporia وAverta عنوان URL أساسياً + مفتاح API؛ ويأخذ الـ webhook عنوان URL + ترويسة مصادقة + سر HMAC.

حقول القاعدة

الحقلالمعنى
connection_idالتكامل المتصل المراد استخدامه (المسار الموصى به — يُحَل المزود + الأسرار من تكامل مساحة العمل وقت التشغيل).
timeout_msيحدّ استدعاء المزود الواحد. 0 ← الافتراضي.
fail_opentrue (الافتراضي) ← خطأ المزود يُلاحَظ لكن الطلب يستمر؛ false ← عامل خطأ النقل / المهلة / المزود المجهول كحجب.
تُخزَّن الأسرار مشفّرة ومقنّعة عند القراءة. يحمل استدعاء الفحص إلغاء طلب الترحيل، بحيث لا يترك طلب مُلغى استدعاء مزود معلّقاً.

10. القابلية للملاحظة

تترك حواجز الحماية آثاراً يمكنك التصرف بناءً عليها.

تغذية المطابقات

كل قاعدة تُطلق تسجّل مطابقة — نوع القاعدة، الإجراء، سلسلة تفصيل، المرحلة، و(عند التفعيل) السلسلة الفرعية المطابقة. علامة التبويب Matches على صفحة Guardrails هي التغذية على مستوى مساحة العمل: سرد، تجميع، تصفية، التعمق في مطابقة واحدة، التصدير إلى CSV، ووسم الإيجابيات الكاذبة.
التقاط المحتوى الخام اختياري. مفتاح Log raw content لحاجز الحماية مُطفأ افتراضياً — الموقف المحافظ على الخصوصية. مع إطفائه، تسجّل تغذية المطابقات أن قاعدة أُطلقت وسلسلة التفصيل الوصفية الخاصة بها، لكن ليس السلسلة الفرعية المطابقة الفعلية (مثل عنوان البريد الإلكتروني نفسه). فعّله لكل حاجز حماية عندما تحتاج السلسلة الفرعية للفرز؛ الإعداد غير رجعي.

الإحصائيات

تشغّل تغذية المطابقات إحصائيات لكل حاجز حماية — تُظهر كل بطاقة حاجز خطاً بيانياً مصغراً للمطابقات على 7 أيام وعداداً، وتحمل علامة التبويب Matches إجمالي مساحة العمل. لتشريح النشاط حسب السياسة، استخدم العرض المجمّع لتغذية المطابقات ومرشحاتها (حسب حاجز الحماية، نوع القاعدة، الإجراء) — فهناك يعيش الاستخدام لكل حاجز حماية، ومزيج الإجراءات، ومعدل الإيجابيات الكاذبة.

تاريخ الإصدارات والتدقيق

كل إنشاء وتحديث وحذف يكتب صف تاريخ مُصدَّر في نفس معاملة التغيير. افتح History على صف حاجز حماية لـ:
  • رؤية كل إصدار مع من غيّره ومتى.
  • Diff أي إصدارين.
  • Revert إلى إصدار أقدم (يُسجَّل كإصدار جديد — لا يُعدَّل التاريخ أبداً).

11. العلاقة مع بقية البوابة

السطحكيف يتكامل مع Guardrails؟
Modelsحواجز الحماية محايدة للنموذج. نفس السياسة تركب على GPT-5 وClaude وGemini — تفحص النص، وليس اختيار النموذج.
Routingمستقل. يقرر التوجيه أي نموذج/قناة تخدم الطلب؛ بينما تفحص حواجز الحماية نص الطلب/الاستجابة نفسه بغض النظر عن ذلك ولا تتجاوز أبداً اختيار النموذج. يجري فحص input قبل الاستدعاء الأمامي، وفحص output بعد أن يستجيب النموذج. وتحل قواعد judge وgrounding نموذجها الخاص عبر قنوات مساحة عملك، بشكل منفصل عن توجيه الطلب.
Promptsمستقلان ومتكاملان. المطالبات تحقن رسالة نظام؛ وحواجز الحماية تفحص المحتوى وتبوّبه. يمكن أن ينطبق كلاهما على طلب واحد وتعمل حواجز الحماية دائماً. الترتيب مهم: تفحص قواعد input طلب المستدعي قبل حقن مطالبة من السجل (يحدث الحقن لاحقاً، في مرحلة التوجيه)، لذا ترى قواعد input رسائل المستدعي وليس مطالبة النظام المحقونة؛ أما قواعد output فتفحص استجابة النموذج في الحالتين.
API Keysيرتبط المفتاح بحاجز حماية عبر guardrail_id. يعيش الربط على المفتاح في البوابة، لذا فإن تعديل حاجز الحماية ينقل كل مفتاح مرتبط دفعة واحدة؛ عدم وجود ربط يتراجع إلى افتراضي مساحة العمل.
تغذية المطابقاتكل قاعدة تُطلق تهبط في تغذية المطابقات لمساحة العمل (مخزنها الخاص، منفصل عن سجل الطلب). جمّعها وصفّها حسب حاجز الحماية، ونوع القاعدة، والإجراء لرؤية الاستخدام، ومزيج الإجراءات، ومعدل الإيجابيات الكاذبة لكل حاجز حماية.

12. مرجع API

جميع المسارات ضمن نطاق مساحة العمل عبر رأس X-Workspace-Id. يُفرض RBAC باستمرار: القراءات والـ sandbox الاختباري مفتوحة لكل عضو؛ الكتابات تتطلب Developer+ (وصلاحية guardrails:write)؛ تغييرات حركة الإنتاج (الحذف، التراجع، تكوين المزود) مبوّبة وفقاً لذلك.

حواجز الحماية

الطريقة والمسارالدورالغرض
GET /api/guardrail/Memberقائمة حواجز الحماية (مع عدد المفاتيح المرتبطة).
GET /api/guardrail/metaMemberمفردات المحرك — أنواع القواعد، المراحل، الإجراءات، كيانات PII، الإعدادات المسبقة، فئات الإعدادات المسبقة.
GET /api/guardrail/my-permissionsMemberصلاحيات حواجز الحماية للمستدعي (لتبويب الواجهة).
GET /api/guardrail/:idMemberتفاصيل حاجز حماية واحد.
GET /api/guardrail/:id/tokensMemberمفاتيح API المرتبطة بهذا الحاجز (محدودة، مع الإجمالي الحقيقي).
POST /api/guardrail/testMemberالـ sandbox — تقييم سياسة على نص عينة في مرحلة. لا يُحفظ شيء.
POST /api/guardrail/Developer+إنشاء حاجز حماية.
PUT /api/guardrail/Developer+تحديث حاجز حماية (يكتب إصدار تاريخ جديداً).
DELETE /api/guardrail/:idDeveloper+حذف حاجز حماية.

التاريخ

الطريقة والمسارالدورالغرض
GET /api/guardrail/:id/historyMemberتاريخ الإصدارات (الأحدث أولاً).
GET /api/guardrail/:id/history/diffMemberDiff إصدارين.
GET /api/guardrail/:id/history/:versionMemberإصدار تاريخي واحد.
POST /api/guardrail/:id/revertDeveloper+استعادة إصدار أقدم كإصدار جديد.

التقييم والمجموعات

الطريقة والمسارالدورالغرض
POST /api/guardrail/:id/evalMemberتشغيل تقييم على مجموعة (اسم مُرفق أو JSONL مرفوع).
GET /api/guardrail/:id/eval/runsMemberقائمة تشغيلات التقييم لحاجز حماية (مُرقَّمة الصفحات).
GET /api/guardrail/eval/runs/:run_idMemberتفاصيل تشغيل تقييم واحد.
GET /api/guardrail/eval/corporaMemberقائمة مجموعات مساحة العمل + المجموعات المُرفقة.
POST /api/guardrail/eval/corporaDeveloper+رفع مجموعة JSONL.
GET /api/guardrail/eval/corpora/:idMemberتفاصيل المجموعة.
DELETE /api/guardrail/eval/corpora/:idDeveloper+حذف مجموعة.

المطابقات

الطريقة والمسارالدورالغرض
GET /api/guardrail/matchMemberقائمة المطابقات (ضمن نطاق مساحة العمل).
GET /api/guardrail/match/groupedMemberالمطابقات مجمّعة (مثلاً حسب القاعدة أو حاجز الحماية).
GET /api/guardrail/match/statsMemberإحصائيات المطابقات (يدعم ?days= و?group_by=).
GET /api/guardrail/match/exportMemberتصدير المطابقات كـ CSV.
GET /api/guardrail/match/:idMemberتفاصيل مطابقة واحدة.
POST /api/guardrail/match/:id/mark-fpAdminوسم مطابقة كإيجابية كاذبة (rate-limited).
DELETE /api/guardrail/match/:id/mark-fpAdminإلغاء وسم إيجابية كاذبة (rate-limited).

ربط مفتاح

اضبط guardrail_id على مفتاح API (عبر محرر المفتاح أو واجهة token البرمجية). 0/null يعني لا ربط صريح — يتراجع المفتاح إلى حاجز الحماية الافتراضي لمساحة العمل، إن كان مضبوطاً.

13. الأسئلة الشائعة

السلوك متطابق بايت ببايت مع مساحة عمل لم تفعّل الميزة أبداً. إذا لم يكن المفتاح مرتبطاً ولم يُضبط افتراضي لمساحة العمل، فإن البوابة لا تجري أي تعديلات. لا يُحجب ولا يُخفى ولا يُسجَّل شيء في تغذية المطابقات.
لا. حجب مرحلة input يُطلق قبل قياس الاستخدام؛ وحجب مرحلة output يردّ الحصة المستهلكة مسبقاً بعد رفض الاستجابة. في كلتا الحالتين لا يدفع المستدعي أي حصة، ويحصل على HTTP 400 guardrail_blocked، ويُعلَّم الطلب بـ skip-retry (إعادة تشغيل نفس المطالبة مقابل قناة أخرى ستحجب مجدداً فحسب).
يعتمد ذلك على الإجراء. يُفرض Block بكلا الطريقتين: على الاستجابة غير المبثوثة تُفحص الإجابة قبل إرجاعها، وعلى الاستجابة المبثوثة يقطع ماسح البث التدفق في منتصفه ويصدر رسالة بديلة قبل أن يصل أي محتوى محجوب إلى العميل. أما Mask على المخرجات فينطبق حالياً على الاستجابات غير المبثوثة فقط — على الاستجابة المبثوثة يمر الجزء الأصلي دون إخفاء (إعادة كتابة التدفق ضمن المسار تحسين مخطط له). للإخفاء على المخرجات اليوم، استخدم طلبات غير مبثوثة أو اعتمد على الإخفاء في مرحلة المدخلات (input). أثبت مجموعة المرحلة/البث المحددة لديك في الـ sandbox وبتشغيل تقييم قبل الاعتماد عليها.
Mask ينقّح المطابقة (مثل jane@acme.com[EMAIL]) ويمرر الطلب بالنص المُنقّى — لا يرى النموذج الأعلى الأصل أبداً. Block يرفض الطلب بأكمله بـ HTTP 400. Flag لا يغيّر شيئاً في حركة المرور ويسجّل مطابقة فقط — استخدمه لقياس قاعدة قبل فرضها.
القاعدة المدمجة (keyword / regex / PII / max_chars) لا تجري أي استدعاء نموذج ولا تحاسب شيئاً. قاعدة llm_judge أو grounding تستدعي نموذجاً عبر قنوات مساحة عملك، لذا تُفوتر تلك الرموز وتُنسب كسطر فرعي للـ judge.
فعّل Log raw content لحاجز الحماية. مع إطفائه (الافتراضي)، تسجّل تغذية المطابقات أن قاعدة أُطلقت وسلسلة التفصيل الوصفية الخاصة بها لكن ليس السلسلة الفرعية المطابقة — الموقف المحافظ على الخصوصية. المفتاح غير رجعي: يؤثر فقط على المطابقات المسجّلة بعد تفعيله.
نعم. افتح History على حاجز الحماية، قارن الإصدارات بـ diff، وRevert إلى الإصدار الذي تريده. ينسخ Revert محتوى ذلك الإصدار إلى الأمام كإصدار جديد — لا يُعدَّل التاريخ أبداً — ويحدث التغيير أثره في الطلب التالي.
افتراضياً، تتبع القواعد المتقدمة fail open: تُسجَّل المهلة أو خطأ النقل كقياس عن بُعد ويستمر الطلب. اضبط fail_open (external) أو judge_fail_open (judge) إلى false لـ fail closed — معاملة الخطأ كحجب — للسياسات التي يكون فيها فحص فائت غير مقبول.