الانتقال إلى المحتوى الرئيسي
المطالبة الجامحة فاتورة جامحة. وكيل يلصق نص محادثة بحجم 400KB في السياق، حلقة إعادة محاولة تظل تعيد إرسال نفس الطلب المتضخم، نموذج يبثّ جداراً من النص بـ 50,000 حرف — كل واحد يفوتر رموزاً لم تقصد إنفاقها أبداً. تضع فئة الإعدادات المسبقة cost سقفاً قاطعاً أمام تلك الطلبات بحيث توقفها البوابة قبل أن تصل إلى النموذج الأعلى وتُقاس. هذه صفحة مركّزة لحالة استخدام التحكم في التكلفة. لمحرك حواجز الحماية الكامل — كل نوع قاعدة، وحقل، ومسار — انظر مرجع حواجز الحماية.

1. حالة استخدام حاجز حماية تكلفة LLM

الذراع نوع قاعدة مدمج واحد: max_chars. يحدّ عدد أحرف النص في مرحلة. لا استدعاء نموذج، ولا قفزة شبكة — فحص طول حتمي يعمل على الطلب قبل القياس، أو على الاستجابة بعد أن يعود النموذج. شكلان، يُختاران بـ إجراء القاعدة:

احجب الطلبات المفرطة الحجم

على قاعدة max_chars للطلب بإجراء block، أي مطالبة فوق الحد تُرفض بـ HTTP 400 guardrail_blocked — والطلب المحجوب لا يكلّف أي حصة، لأن الحجب يُطلق قبل قياس الاستخدام.

قصّ الاستجابات المفرطة الحجم

على قاعدة max_chars بإجراء mask، يُقتطع النص إلى الحد بدلاً من رفضه — ما زال المستدعي يحصل على إجابة قابلة للاستخدام، لكن محدودة. مفيد في مرحلة الاستجابة لوضع سقف للخروج.
يحسب السقف الأحرف (مدرك للأحرف — 日本語 ثلاثة، لا تسعة)، لا الرموز. يترجم الإعداد المسبق الموجّه للرموز المشحون ميزانية رموز إلى سقف أحرف بنسبة char→token القياسية؛ شدّد حقل max_chars للقاعدة مباشرة لميزانية أصرم.

2. إعدادات التكلفة المسبقة المشحونة

افتح زر New guardrail المنقسم في وحدة التحكم واختر من فئة قوالب cost. ثلاثة إعدادات مسبقة تبذر قاعدة max_chars واحدة لكل منها:
الإعداد المسبقالمرحلة · الإجراءالسقف
Prompt-Size Capinput · block50,000 حرف
Token Cost Cap (prompt)input · block200,000 حرف (~50K رمز)
Response Size Capoutput · block32,000 حرف
كل إعداد مسبق بذرة، لا قفل — طبّقه، ثم حرّر قيمة max_chars أو المرحلة أو الإجراء لتناسب ميزانيتك. تأليف وتحرير حواجز الحماية يتطلب Developer+ في مساحة العمل.
Response Size Cap سقف مرحلة مخرجات. لـقصّ إجابة طويلة بدلاً من رفضها، بدّل إجراءها إلى mask — تقتطع البوابة الاستجابة إلى الحد وما زال المستخدم يحصل على ردّ مقتطع لكن قابل للاستخدام بدلاً من خطأ.

3. ألّف سقفك الخاص

قاعدة التكلفة أبسط قاعدة في المحرك — مرحلة، وإجراء، وعدد صحيح. لوضع سقف للطلبات عند 20,000 حرف ورفض أي شيء أكبر:
{
  "type": "max_chars",
  "stage": "input",
  "action": "block",
  "max_chars": 20000
}
أضفها إلى أي حاجز حماية في وحدة التحكم. يجب أن يكون max_chars عدداً صحيحاً موجباً؛ يرفض المدقق 0 أو القيم السالبة.

4. اختبر قبل أن تربط

أثبت أن السقف يُطلق حيث تتوقع قبل أن يشير إليه أي مفتاح. افتح علامة التبويب Test داخل محرر حاجز الحماية، الصق عينة، اختر مرحلة input، وشغّل السياسة الحالية محلياً — بدون استدعاء للأعلى، بدون حصة. عينة فوق الحد تعيد حكماً محجوباً؛ وعينة تحت الحد تمر دون مساس. لقاعدة قصّ، يُظهر الـ sandbox النص المُصيَّر المقتطع، بحيث يمكنك تأكيد أن السقف يهبط على حدّ حرف قبل الاعتماد عليه.

5. اربط السقف بمفتاح

حاجز حماية التكلفة يُحَل تماماً كأي آخر — اربطه بمفتاح API، أو اضبطه افتراضي مساحة العمل. كل خطوة هنا إجراء وحدة تحكم تحت جلستك الخاصة.
1

احفظ حاجز الحماية

أنشئ أو افتح حاجز حماية في وحدة التحكم، أضف قاعدة max_chars (أو طبّق إعداد تكلفة مسبقاً)، واحفظ.
2

اربط مفتاحاً

حرّر مفتاح API واختر حاجز الحماية من قائمة Guardrail المنسدلة (يضبط guardrail_id على المفتاح)، أو علّم حاجز الحماية افتراضي مساحة العمل. انظر اربط بمفتاح وافتراضي الحساب.
3

أرسل طلباً

باستخدام ذلك المفتاح، استدعِ OrcaRouter تماماً كما كان — بدون ترويسات جديدة، بدون تغيير في SDK:
curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "...a very long prompt..."}
    ]
  }'
إذا كانت المطالبة فوق السقف، يعيد الاستدعاء HTTP 400 guardrail_blocked ولا يُفوتر شيء.

6. ماذا يكلّف طلب محجوب

سقف مرحلة الطلب أرخص حاجز حماية لفرضه: يعمل قبل قياس الاستخدام، فتُرفض المطالبة المفرطة الحجم بتكلفة حصة صفر.
لا. حجب مرحلة المدخلات يُطلق قبل القياس. وحجب مرحلة المخرجات يردّ الحصة المستهلكة مسبقاً بعد رفض الاستجابة. في الحالتين لا يدفع المستدعي أي حصة، ويحصل على HTTP 400 guardrail_blocked، ويُعلَّم الطلب بـ skip-retry — إعادة تشغيل نفس المطالبة المفرطة الحجم ستحجب مجدداً فحسب. انظر خطأ guardrail_blocked.
block بـ max_chars في مرحلة المخرجات مفروض بكلتا الطريقتين: على الاستجابة غير المبثوثة تُفحص الإجابة قبل إرجاعها، وعلى الاستجابة المبثوثة يقطع ماسح التدفق في منتصفه بمجرد أن يعبر المخزن السقف. أما mask (القصّ) على المخرجات فينطبق حالياً على الاستجابات غير المبثوثة فقط. انظر تغطية البث.
لا. قاعدة max_chars ليس لها مفهوم سلسلة فرعية، فتسجّل تغذية المطابقات أن السقف أُطلق — نوعه وإجراءه ومرحلته — لكن ليس أبداً سلسلة فرعية مطابقة، حتى مع تفعيل Log raw content. تحصل على إشارة أنه أُطلق دون إعادة التقاط الحمولة المفرطة الحجم.

7. أين يلائم هذا

سقف max_chars ذراع تكلفة فظّ — سقف قاطع، لا ميزانية إنفاق لكل مفتاح. لوضع سقف بالدولار بدلاً من الأحرف، اضبط credit_limit_usd على مفتاح API نفسه (0 = غير محدود)، الذي تفرضه البوابة باستقلال عن أي حاجز حماية. الاثنان يتكدّسان: ميزانية المفتاح تحدّ الإنفاق الكلي، وحاجز حماية التكلفة يحدّ حجم أي طلب أو استجابة منفردة.
حاجز حماية التكلفة يفحص حجم المحتوى، لا اختيار النموذج أو قرار التوجيه. يرفض مطالبة مفرطة الحجم بغض النظر عن أي نموذج يخدمها. لحكم استدعاءات أدوات وكيل — رفض الإجراءات المدمّرة أو حجزها للموافقة — استخدم جدار الحماية، الذي يقرر على سطح استدعاء الأداة (allow / deny / pending_approval)، لا على سطح المحتوى.

8. إلى أين تذهب بعد ذلك

قواعد مرحلة المدخلات

كيف يعمل فحص الطلب قبل الاستدعاء الأعلى وقبل القياس.

قواعد مرحلة المخرجات

فحص وقصّ استجابة النموذج، بثاً ولا.

خطأ guardrail_blocked

شكل الـ HTTP 400، وضمان لا-حصة، وskip-retry.

الاختبار والتقييم

أثبت سقفاً مقابل مجموعة قبل أن تربط مفتاحاً.
سقوف التكلفة تحدّ الحجم. لتحديد المحتوى — PII، الأسرار، المطالبات غير الآمنة — ابدأ من نظرة عامة على حواجز الحماية أو اقرأ مرجع حواجز الحماية للمحرك الكامل.