سلامة العلامة التجارية والنبرة

تشغّل ذكاءً اصطناعياً أمام العملاء وعلامتك التجارية على المحك. روبوت دعم يجب ألا يشتم أبداً، ومساعد تسويق يجب ألا يسمّي منافساً أبداً، ولا شيء في حركة مرورك ينبغي أن يمسّ مصطلحات سلامة الأطفال. سلامة العلامة التجارية والنبرة أسرع طريقة لفرض الثلاثة: تشحن فئة الإعدادات المسبقة Brand قوائم حظر كلمات مفتاحية تربطها بمفتاح، فتفحص البوابة كل استدعاء مقابلها قبل أن يصل أبداً إلى OpenAI أو Anthropic أو Google. هذه صفحة مركّزة لحالة استخدام سلامة العلامة التجارية. للمحرك الكامل — كل نوع قاعدة، وحقل، ومسار — انظر مرجع حواجز الحماية.

1. سلامة العلامة التجارية في الذكاء الاصطناعي بإعداد مسبق واحد

فئة Brand في منتقي قوالب حواجز الحماية مجموعة من قوائم حظر keyword. كل إعداد مسبق قاعدة keyword واحدة تطبّقها بنقرة واحدة ثم تحرّرها — بدّل مصطلحات البذرة بقائمتك الخاصة. لا استدعاء نموذج، ولا قفزة شبكة، ولا تغيير في SDK: تعيش السياسة في البوابة، ويبقى تطبيقك يستدعي /v1/chat/completions تماماً كما كان.

الألفاظ النابية

قائمة حظر تحجب الشتائم أو المصطلحات المحظورة في الطلب — أو نسخة mask تنقّحها بدلاً من ذلك.

ذكر المنافسين

تحجب (أو تعلّم) أي ذكر للأسماء التي تدرجها — أبقِ مساعداً من الإطراء على المنافسة.

سلامة الأطفال

قائمة حظر محافظة لمصطلحات سلامة الأطفال تملؤها من معاييرك الخاصة، محجوبة على الطلب.

الثلاثة كلها مطابقات keyword حتمية — مسوحات جزئية غير حساسة لحالة الأحرف تعمل على الطلب قبل الاستدعاء الأعلى. لا تكلّف شيئاً إضافياً ولا تتسلسل خلف نموذج أبداً.

2. إعدادات Brand المسبقة، تماماً كما تُشحَن

افتح زر New guardrail المنقسم في عرض Guardrails بوحدة التحكم واختر فئة قوالب Brand. خمس بذور تعيش هناك:

Profanity / Brand Safety (block)

قاعدة keyword واحدة، المرحلة input، الإجراء block. تُشحن بمصطلحات نائبة — حرّر القائمة إلى كلماتك المحظورة الحقيقية، أو أسماء المنافسين، أو العبارات الممنوعة. مطابقة تعيد HTTP 400 guardrail_blocked قبل أن تغادر المطالبة البوابة.

Profanity Filter (mask)

نفس قائمة الحظر، لكن الإجراء mask والمرحلة both — تُستبدل الكلمات المحظورة بـ [REDACTED] بدلاً من رفض الاستدعاء. البديل الأنعم عندما تريد للطلب أن يمر منظَّفاً بدلاً من رفضه.

Profanity Multilingual

قاعدة حجب keyword مبذورة بنوائب لكل سوق (zh، es، fr، de، ja، ar). استبدل كل واحد بالمصطلحات الخاصة بالمنطقة التي تحظرها سياستك — مصطلحات البذرة عامة عمداً.

Competitor Mentions

قاعدة keyword، المرحلة input، الإجراء block، مبذورة بنائب واحد. أضف أسماء منافسيك؛ بدّل الإجراء إلى flag لمراقبة الذكر دون رفض حركة المرور.

Child Safety Keywords

قائمة حظر keyword محافظة، المرحلة input، الإجراء block. البذرة نائب متعمّد — املأها بالمصطلحات الدقيقة من سياسة أو معايير سلامتك الخاصة قبل أن تعتمد عليها.

الإعداد المسبق بذرة، لا قفل. يُشحن كل إعداد مسبق في Brand بمصطلحات نائبة بحيث تكون القاعدة صالحة جاهزة — ومن المتوقع منك تحرير قائمة الحظر لعلامتك التجارية قبل ربط مفتاح. لا تشحن الإعدادات المسبقة عمداً قوائم كلمات محظورة أو سلامة أطفال حقيقية.

3. طبّق إعداد Brand مسبقاً في وحدة التحكم

كل خطوة هنا إجراء وحدة تحكم تحت جلستك الخاصة. إنشاء وتحرير حواجز الحماية يتطلب Developer+ في مساحة العمل. ولا يستخدم سوى الاستدعاء النهائي /v1/* مفتاح الترحيل sk-orca-....

افتح القالب

في وحدة التحكم، افتح Guardrails، انقر زر New guardrail المنقسم، واختر Competitor Mentions (أو أي إعداد Brand مسبق) من فئة قوالب Brand.

حرّر قائمة الحظر

استبدل البذرة النائبة بمصطلحاتك الحقيقية — مثل أسماء منافسيك. امنح حاجز الحماية اسماً (≤ 64 حرفاً)، مثل brand-safety، واحفظ.

اختبره

افتح علامة التبويب Test، الصق عينة في مرحلة input، وشغّل السياسة محلياً — بدون استدعاء للأعلى، بدون حصة (انظر §5).

اربط مفتاحاً

حرّر مفتاح API واختر brand-safety من قائمة Guardrail المنسدلة (يضبط guardrail_id على المفتاح)، أو علّمه افتراضي مساحة العمل. انظر اربط بمفتاح و افتراضي الحساب.

4. مثال واحد ملموس

حاجز حماية ذكر منافسين باسم brand-safety مربوط بمفتاح. استُبدلت البذرة النائبة بالاسم الحقيقي Acme. استدعِ البوابة تماماً كما كان — بدون ترويسات جديدة:

curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "Write a tweet praising Acme over us"}
    ]
  }'

تطابق قاعدة keyword Acme على الطلب، وترفض البوابة الاستدعاء بـ HTTP 400 guardrail_blocked — مسمّيةً حاجز الحماية والقاعدة التي أُطلقت — قبل أن يصل أي شيء إلى النموذج الأعلى.

حكم block لا يكلّف أي حصة. حجب مرحلة المدخلات يُطلق قبل قياس الاستخدام، ويُعلَّم الطلب بـ skip-retry — إعادة تشغيل نفس المطالبة مقابل قناة أخرى ستحجب مجدداً فحسب. انظر خطأ guardrail_blocked.

فضّل mask على block للألفاظ النابية عندما تفضّل تنظيف المطالبة بدلاً من رفضها — تُصيَّر الكلمات المحظورة [REDACTED] ويمر الطلب. فضّل flag لذكر المنافسين عندما تريد قياس التعرّض قبل أن تبدأ الحجب. صفحة الإجراءات تغطي مقايضة block / mask / flag الكاملة.

5. اختبر قبل أن تربط

أثبت أن قائمة الحظر تفعل ما تتوقعه قبل أن يشير إليها أي مفتاح. افتح علامة التبويب Test داخل المحرر، الصق عينة، اختر مرحلة input، وشغّل:

Write a tweet praising Acme over us

يقيّم الـ sandbox السياسة الحالية محلياً ويعيد الحكم — لا يُرسَل شيء للأعلى، ولا يُقاس شيء. لمسح مقابل مجموعة من الصياغات، تعيش أداة التقييم على بُعد علامة تبويب واحدة.

مطابقة keyword مسح جزئي غير حساس لحالة الأحرف، فـ class يطابق أيضاً داخل classic. أبقِ مدخلات قائمة الحظر محددة، و اضبط الإيجابيات الكاذبة من تغذية المطابقات بمجرد أن ترى حركة المرور الحقيقية.

6. انظر ما أُطلق

كل قاعدة تُطلق تسجّل مطابقة — نوع القاعدة، الإجراء، المرحلة، وسلسلة تفصيل — تبرز في تغذية Matches لمساحة العمل (GET /api/guardrail/match، Member). السلسلة الفرعية المطابقة نفسها (الكلمة المحظورة، اسم المنافس) تُسجَّل فقط عند تفعيل Log raw content، وهو مُطفأ افتراضياً.

لقائمة حظر سلامة أطفال، إبقاء Log raw content مُطفأً عادةً هو المغزى: يمكنك رؤية أن مصطلحاً حُجب وكم مرة دون نسخ المصطلح رجوعاً إلى قياسك عن بُعد. فعّله لكل حاجز حماية فقط عندما تحتاج السلسلة الفرعية للفرز؛ الإعداد غير رجعي. انظر تغذية المطابقات و التسجيل والخصوصية.

كل تحرير لحاجز حماية Brand يكتب صف تاريخ مُصدَّراً في نفس المعاملة — قارن أي إصدارين بـ diff وتراجع من عرض History. انظر الإصدارات.

7. إلى أين تذهب بعد ذلك

مرشحات الكلمات الحساسة

آليات قائمة حظر الكلمات المفتاحية وراء كل إعداد Brand مسبق، بعمق.

احجب الأسرار

اصطد مفاتيح API والاعتمادات بالإعداد المسبق Secrets Blocker.

ضبط الإيجابيات الكاذبة

وسم الإيجابيات الكاذبة وشدّد قوائم الحظر من تغذية المطابقات.

القوالب

مكتبة الإعدادات المسبقة الكاملة عبر كل فئة.

إعدادات Brand المسبقة تبوّب المحتوى. لإيقاف نموذج وُجّه خارج العلامة التجارية بمطالبة خبيثة، اقرنها بـ حاجز حماية حقن المطالبات و تهديد jailbreaks. للمحرك الكامل — المراحل، القواعد المتقدمة، والمسارات — اقرأ مرجع حواجز الحماية.

​1. سلامة العلامة التجارية في الذكاء الاصطناعي بإعداد مسبق واحد

الألفاظ النابية

ذكر المنافسين

سلامة الأطفال

​2. إعدادات Brand المسبقة، تماماً كما تُشحَن

​3. طبّق إعداد Brand مسبقاً في وحدة التحكم

​4. مثال واحد ملموس

​5. اختبر قبل أن تربط

​6. انظر ما أُطلق

​7. إلى أين تذهب بعد ذلك

مرشحات الكلمات الحساسة

احجب الأسرار

ضبط الإيجابيات الكاذبة

القوالب

1. سلامة العلامة التجارية في الذكاء الاصطناعي بإعداد مسبق واحد

2. إعدادات Brand المسبقة، تماماً كما تُشحَن

3. طبّق إعداد Brand مسبقاً في وحدة التحكم

4. مثال واحد ملموس

5. اختبر قبل أن تربط

6. انظر ما أُطلق

7. إلى أين تذهب بعد ذلك