1. حالة استخدام حاجز حماية تكلفة LLM
الذراع نوع قاعدة مدمج واحد:max_chars. يحدّ عدد أحرف النص في مرحلة.
لا استدعاء نموذج، ولا قفزة شبكة — فحص طول حتمي يعمل على الطلب قبل القياس،
أو على الاستجابة بعد أن يعود النموذج.
شكلان، يُختاران بـ إجراء القاعدة:
احجب الطلبات المفرطة الحجم
على قاعدة
max_chars للطلب بإجراء block، أي مطالبة فوق الحد
تُرفض بـ HTTP 400 guardrail_blocked — والطلب المحجوب لا يكلّف أي
حصة، لأن الحجب يُطلق قبل قياس الاستخدام.قصّ الاستجابات المفرطة الحجم
على قاعدة
max_chars بإجراء mask، يُقتطع النص إلى الحد بدلاً من
رفضه — ما زال المستدعي يحصل على إجابة قابلة للاستخدام، لكن محدودة.
مفيد في مرحلة الاستجابة لوضع سقف للخروج.يحسب السقف الأحرف (مدرك للأحرف —
日本語 ثلاثة، لا تسعة)، لا الرموز.
يترجم الإعداد المسبق الموجّه للرموز المشحون ميزانية رموز إلى سقف أحرف
بنسبة char→token القياسية؛ شدّد حقل max_chars للقاعدة مباشرة لميزانية
أصرم.2. إعدادات التكلفة المسبقة المشحونة
افتح زر New guardrail المنقسم في وحدة التحكم واختر من فئة قوالب cost. ثلاثة إعدادات مسبقة تبذر قاعدةmax_chars واحدة لكل منها:
| الإعداد المسبق | المرحلة · الإجراء | السقف |
|---|---|---|
| Prompt-Size Cap | input · block | 50,000 حرف |
| Token Cost Cap (prompt) | input · block | 200,000 حرف (~50K رمز) |
| Response Size Cap | output · block | 32,000 حرف |
max_chars أو
المرحلة أو الإجراء لتناسب ميزانيتك. تأليف وتحرير حواجز الحماية يتطلب
Developer+ في مساحة العمل.
3. ألّف سقفك الخاص
قاعدة التكلفة أبسط قاعدة في المحرك — مرحلة، وإجراء، وعدد صحيح. لوضع سقف للطلبات عند 20,000 حرف ورفض أي شيء أكبر:max_chars عدداً
صحيحاً موجباً؛ يرفض المدقق 0 أو القيم السالبة.
4. اختبر قبل أن تربط
أثبت أن السقف يُطلق حيث تتوقع قبل أن يشير إليه أي مفتاح. افتح علامة التبويب Test داخل محرر حاجز الحماية، الصق عينة، اختر مرحلةinput،
وشغّل السياسة الحالية محلياً — بدون استدعاء للأعلى، بدون حصة. عينة فوق
الحد تعيد حكماً محجوباً؛ وعينة تحت الحد تمر دون مساس.
لقاعدة قصّ، يُظهر الـ sandbox النص المُصيَّر المقتطع، بحيث يمكنك تأكيد
أن السقف يهبط على حدّ حرف قبل الاعتماد عليه.
5. اربط السقف بمفتاح
حاجز حماية التكلفة يُحَل تماماً كأي آخر — اربطه بمفتاح API، أو اضبطه افتراضي مساحة العمل. كل خطوة هنا إجراء وحدة تحكم تحت جلستك الخاصة.احفظ حاجز الحماية
أنشئ أو افتح حاجز حماية في وحدة التحكم، أضف قاعدة
max_chars (أو
طبّق إعداد تكلفة مسبقاً)، واحفظ.اربط مفتاحاً
حرّر مفتاح API واختر حاجز الحماية من قائمة Guardrail المنسدلة
(يضبط
guardrail_id على المفتاح)، أو علّم حاجز الحماية افتراضي
مساحة العمل. انظر اربط بمفتاح
وافتراضي الحساب.6. ماذا يكلّف طلب محجوب
سقف مرحلة الطلب أرخص حاجز حماية لفرضه: يعمل قبل قياس الاستخدام، فتُرفض المطالبة المفرطة الحجم بتكلفة حصة صفر.هل يكلّف طلب مفرط الحجم محجوب حصة؟
هل يكلّف طلب مفرط الحجم محجوب حصة؟
لا. حجب مرحلة المدخلات يُطلق قبل القياس. وحجب مرحلة المخرجات يردّ
الحصة المستهلكة مسبقاً بعد رفض الاستجابة. في الحالتين لا يدفع
المستدعي أي حصة، ويحصل على HTTP 400
guardrail_blocked، ويُعلَّم
الطلب بـ skip-retry — إعادة تشغيل نفس المطالبة المفرطة الحجم
ستحجب مجدداً فحسب. انظر
خطأ guardrail_blocked.هل يُفرض سقف الاستجابة على البث؟
هل يُفرض سقف الاستجابة على البث؟
block بـ
max_chars في مرحلة المخرجات مفروض بكلتا الطريقتين:
على الاستجابة غير المبثوثة تُفحص الإجابة قبل إرجاعها، وعلى الاستجابة
المبثوثة يقطع ماسح التدفق في منتصفه بمجرد أن يعبر المخزن السقف. أما
mask (القصّ) على المخرجات فينطبق حالياً على الاستجابات غير
المبثوثة فقط. انظر
تغطية البث.هل تُظهر قاعدة تكلفة النص المطابق في التغذية؟
هل تُظهر قاعدة تكلفة النص المطابق في التغذية؟
لا. قاعدة
max_chars ليس لها مفهوم سلسلة فرعية، فتسجّل
تغذية المطابقات أن السقف
أُطلق — نوعه وإجراءه ومرحلته — لكن ليس أبداً سلسلة فرعية مطابقة، حتى
مع تفعيل Log raw content. تحصل على إشارة أنه أُطلق دون إعادة
التقاط الحمولة المفرطة الحجم.7. أين يلائم هذا
سقفmax_chars ذراع تكلفة فظّ — سقف قاطع، لا ميزانية إنفاق لكل مفتاح.
لوضع سقف بالدولار بدلاً من الأحرف، اضبط credit_limit_usd على مفتاح
API نفسه (0 = غير محدود)، الذي تفرضه البوابة باستقلال عن أي حاجز حماية.
الاثنان يتكدّسان: ميزانية المفتاح تحدّ الإنفاق الكلي، وحاجز حماية التكلفة
يحدّ حجم أي طلب أو استجابة منفردة.
8. إلى أين تذهب بعد ذلك
قواعد مرحلة المدخلات
كيف يعمل فحص الطلب قبل الاستدعاء الأعلى وقبل القياس.
قواعد مرحلة المخرجات
فحص وقصّ استجابة النموذج، بثاً ولا.
خطأ guardrail_blocked
شكل الـ HTTP 400، وضمان لا-حصة، وskip-retry.
الاختبار والتقييم
أثبت سقفاً مقابل مجموعة قبل أن تربط مفتاحاً.
