orcarouter/{name} فيقوم OrcaRouter بحلّه إلى نموذج فعلي وقت الطلب، استنادًا إلى القواعد التي ضبطتها.
هذا مفيد حين تريد:
- تبديل سلوك التوجيه دون إعادة نشر تطبيقك (غيّر الموجّه من لوحة التحكّم؛ تبقى شيفرتك كما هي).
- السماح لفرق أو خدمات مختلفة باختيار سياسة التوجيه الخاصة بها باستقلال عن التطبيق الذي يستدعي الواجهة.
- الإشارة إلى منطق توجيه أكثر تعقيدًا من أن يُكتب داخل
extra_body.
استخدام موجّه
X-Orca-Router وX-Orca-Resolved-Model — انظر
ترويسات الاستجابة. أمّا حقل model في جسم الاستجابة نفسه فيعكس ما أعاده المزوّد (غالبًا الاسم العاري للمزوّد، مثل gpt-4o-mini-2024-07-18).
إنشاء موجّه
تُنشأ الموجّهات في لوحة التحكّم ضمن التوجيه. لكل موجّه:- الاسم — هو
{name}فيorcarouter/{name}. يجب أن يكون فريدًا داخل مساحة عملك؛ أحرف لاتينية صغيرة وأرقام و_و-(من 1 إلى 50 حرفًا). الاسمorcarouterمحجوز. - النماذج المسموح بها — نمط أو أكثر من نوع glob (مفصولة بفاصلة أو سطر جديد، غير حسّاسة لحالة الأحرف) تحدّ من النماذج التي يستطيع هذا الموجّه اختيارها. أمثلة:
openai/*أوopenai/*, anthropic/claude-haiku-*. الفراغ يطابق كلّ نموذج يملك حسابك صلاحية الوصول إليه. - الاستراتيجية — كيف تُختار من بين النماذج المطابقة. انظر الاستراتيجيات أدناه.
- النماذج العادية / النماذج الصعبة — قوائم نماذج إضافية تُستخدم فقط من قبل استراتيجية التكيّفي · المُبوَّب. انظر التكيّفي أدناه.
- النموذج الافتراضي — نموذج شبكة أمان يُستخدم إذا لم يحلّ النمط إلى شيء.
- مُفعَّل — لتعطيل الموجّه دون حذفه.
الاستراتيجيات
يكشف المحرّر عن أربع بطاقات استراتيجية. التكيّفي يجمع وضعين فرعيّين خلفيّين، ليصل المجموع إلى خمس قيم enum يمكن حفظها عبر الواجهة.الأرخص
يختار النموذج ذا أقلّ سعر لكلّ رمز من بين المرشّحين النشطين. الإعداد الافتراضي للموجّهorcarouter/auto المُهيّأ مسبقًا. الأنسب حين تريد أرخص نموذج محادثة نشط في كلّ طلب ولا تهتم بثبات أسلوب الإخراج عبر الاستدعاءات.
الجودة
يختار النموذج ذا أعلى درجة جودة من بين المرشّحين النشطين، بغضّ النظر عن السعر. الأنسب حين تطغى جودة الإخراج على التكلفة.المتوازن
يختار خيارًا منخفض التكلفة يستوفي عتبة جودة؛ وإن لم يستوفِها شيء، يعود إلى الخيار الأعلى جودة. الإعداد الافتراضي للموجّهات الجديدة التي تنشئها بنفسك. يعمل بدون ضبط خاص لكل موجّه.التكيّفي
سارق سياقي LinUCB لكلّ موجّه يتعلّم من حركتك الإنتاجية الحقيقية. يوازن بين الجودة والتكلفة والكمون والموثوقية لكلّ طلب لاختيار أفضل نموذج. تتصرّف الموجّهات الجديدة مثل المتوازن خلال فترة بدء بارد قصيرة (إحماء لكلّ نموذج) قبل أن يبدأ السارق في توجيه الاختيارات — وهذا متوقّع، وليس عيبًا. وضعان فرعيّان:- القياسي (enum في API:
linucb) — يأخذ في الاعتبار كلّ نموذج مسموح به في كلّ طلب. الأنسب حين تكون الحركة موحّدة تقريبًا وتريد من الموجّه أن يجد أفضل خيار من قائمتك الكاملة. - المُبوَّب (enum في API:
gated_adaptive) — تُصنَّف الطلبات أوّلًا إلى عادية أو صعبة؛ تسحب الطلبات العادية من مجموعة النماذج العادية الأصغر، وتسحب الصعبة من مجموعة النماذج الصعبة الأقوى، وتسحب الطلبات متوسّطة الصعوبة من قائمة النماذج المسموح بها كاملة. الأنسب حين تخلط حركتك بين استدعاءات بسيطة ومعقّدة. تُتقاطع كل مجموعة مع النماذج المسموح بها؛ والمجموعات الفارغة أو غير المتداخلة تعود بصمت إلى القائمة الكاملة للمسموح بها، فلا تُحرَم الطلبات أبدًا. اضبط المجموعتين (weak_poolوstrong_poolعلى مستوى الواجهة — حتى 2000 حرف لكلٍّ منهما) في المحرّر عندما تختار المُبوَّب.
الموجّه المُهيّأ مسبقًا: orcarouter/auto
يأتي كلّ حساب OrcaRouter عند التسجيل بموجّه افتراضي اسمه auto — انظر الموجّه التلقائي. يمكنك استخدامه فورًا دون أيّ إعداد.