1. سلامة العلامة التجارية في الذكاء الاصطناعي بإعداد مسبق واحد
فئة Brand في منتقي قوالب حواجز الحماية مجموعة من قوائم حظر keyword. كل إعداد مسبق قاعدةkeyword واحدة تطبّقها بنقرة واحدة ثم
تحرّرها — بدّل مصطلحات البذرة بقائمتك الخاصة. لا استدعاء نموذج، ولا قفزة
شبكة، ولا تغيير في SDK: تعيش السياسة في البوابة، ويبقى تطبيقك يستدعي
/v1/chat/completions تماماً كما كان.
الألفاظ النابية
قائمة حظر تحجب الشتائم أو المصطلحات المحظورة في الطلب — أو نسخة
mask تنقّحها بدلاً من ذلك.
ذكر المنافسين
تحجب (أو تعلّم) أي ذكر للأسماء التي تدرجها — أبقِ مساعداً من
الإطراء على المنافسة.
سلامة الأطفال
قائمة حظر محافظة لمصطلحات سلامة الأطفال تملؤها من معاييرك الخاصة،
محجوبة على الطلب.
2. إعدادات Brand المسبقة، تماماً كما تُشحَن
افتح زر New guardrail المنقسم في عرض Guardrails بوحدة التحكم واختر فئة قوالب Brand. خمس بذور تعيش هناك:Profanity / Brand Safety (block)
Profanity / Brand Safety (block)
قاعدة
keyword واحدة، المرحلة input، الإجراء block. تُشحن
بمصطلحات نائبة — حرّر القائمة إلى كلماتك المحظورة الحقيقية، أو أسماء
المنافسين، أو العبارات الممنوعة. مطابقة تعيد HTTP 400
guardrail_blocked قبل أن تغادر المطالبة البوابة.Profanity Filter (mask)
Profanity Filter (mask)
نفس قائمة الحظر، لكن الإجراء mask والمرحلة both — تُستبدل
الكلمات المحظورة بـ
[REDACTED] بدلاً من رفض الاستدعاء. البديل
الأنعم عندما تريد للطلب أن يمر منظَّفاً بدلاً من رفضه.Profanity Multilingual
Profanity Multilingual
قاعدة حجب
keyword مبذورة بنوائب لكل سوق (zh، es، fr، de، ja، ar).
استبدل كل واحد بالمصطلحات الخاصة بالمنطقة التي تحظرها سياستك —
مصطلحات البذرة عامة عمداً.Competitor Mentions
Competitor Mentions
قاعدة
keyword، المرحلة input، الإجراء block، مبذورة بنائب
واحد. أضف أسماء منافسيك؛ بدّل الإجراء إلى flag لمراقبة الذكر دون
رفض حركة المرور.Child Safety Keywords
Child Safety Keywords
قائمة حظر
keyword محافظة، المرحلة input، الإجراء block.
البذرة نائب متعمّد — املأها بالمصطلحات الدقيقة من سياسة أو معايير
سلامتك الخاصة قبل أن تعتمد عليها.الإعداد المسبق بذرة، لا قفل. يُشحن كل إعداد مسبق في Brand بمصطلحات
نائبة بحيث تكون القاعدة صالحة جاهزة — ومن المتوقع منك تحرير قائمة الحظر
لعلامتك التجارية قبل ربط مفتاح. لا تشحن الإعدادات المسبقة عمداً قوائم
كلمات محظورة أو سلامة أطفال حقيقية.
3. طبّق إعداد Brand مسبقاً في وحدة التحكم
كل خطوة هنا إجراء وحدة تحكم تحت جلستك الخاصة. إنشاء وتحرير حواجز الحماية يتطلب Developer+ في مساحة العمل. ولا يستخدم سوى الاستدعاء النهائي/v1/* مفتاح الترحيل sk-orca-....
افتح القالب
في وحدة التحكم، افتح Guardrails، انقر زر New guardrail
المنقسم، واختر Competitor Mentions (أو أي إعداد Brand مسبق) من
فئة قوالب Brand.
حرّر قائمة الحظر
استبدل البذرة النائبة بمصطلحاتك الحقيقية — مثل أسماء منافسيك. امنح
حاجز الحماية اسماً (≤ 64 حرفاً)، مثل
brand-safety، واحفظ.اختبره
افتح علامة التبويب Test، الصق عينة في مرحلة
input، وشغّل
السياسة محلياً — بدون استدعاء للأعلى، بدون حصة (انظر
§5).اربط مفتاحاً
حرّر مفتاح API واختر
brand-safety من قائمة Guardrail المنسدلة
(يضبط guardrail_id على المفتاح)، أو علّمه افتراضي مساحة العمل.
انظر اربط بمفتاح و
افتراضي الحساب.4. مثال واحد ملموس
حاجز حماية ذكر منافسين باسمbrand-safety مربوط بمفتاح. استُبدلت البذرة
النائبة بالاسم الحقيقي Acme. استدعِ البوابة تماماً كما كان — بدون
ترويسات جديدة:
keyword Acme على الطلب، وترفض البوابة الاستدعاء بـ
HTTP 400 guardrail_blocked — مسمّيةً حاجز الحماية والقاعدة التي
أُطلقت — قبل أن يصل أي شيء إلى النموذج الأعلى.
فضّل mask على block للألفاظ النابية عندما تفضّل تنظيف المطالبة
بدلاً من رفضها — تُصيَّر الكلمات المحظورة [REDACTED] ويمر الطلب. فضّل
flag لذكر المنافسين عندما تريد قياس التعرّض قبل أن تبدأ الحجب. صفحة
الإجراءات تغطي مقايضة block / mask /
flag الكاملة.
5. اختبر قبل أن تربط
أثبت أن قائمة الحظر تفعل ما تتوقعه قبل أن يشير إليها أي مفتاح. افتح علامة التبويب Test داخل المحرر، الصق عينة، اختر مرحلةinput، وشغّل:
6. انظر ما أُطلق
كل قاعدة تُطلق تسجّل مطابقة — نوع القاعدة، الإجراء، المرحلة، وسلسلة تفصيل — تبرز في تغذية Matches لمساحة العمل (GET /api/guardrail/match،
Member). السلسلة الفرعية المطابقة نفسها (الكلمة المحظورة، اسم المنافس)
تُسجَّل فقط عند تفعيل Log raw content، وهو مُطفأ افتراضياً.
لقائمة حظر سلامة أطفال، إبقاء Log raw content مُطفأً عادةً هو المغزى:
يمكنك رؤية أن مصطلحاً حُجب وكم مرة دون نسخ المصطلح رجوعاً إلى قياسك عن
بُعد. فعّله لكل حاجز حماية فقط عندما تحتاج السلسلة الفرعية للفرز؛ الإعداد
غير رجعي. انظر تغذية المطابقات و
التسجيل والخصوصية.
7. إلى أين تذهب بعد ذلك
مرشحات الكلمات الحساسة
آليات قائمة حظر الكلمات المفتاحية وراء كل إعداد Brand مسبق، بعمق.
احجب الأسرار
اصطد مفاتيح API والاعتمادات بالإعداد المسبق Secrets Blocker.
ضبط الإيجابيات الكاذبة
وسم الإيجابيات الكاذبة وشدّد قوائم الحظر من تغذية المطابقات.
القوالب
مكتبة الإعدادات المسبقة الكاملة عبر كل فئة.
