Comment ça marche
Route by difficulty
Le chat informel va directement vers un défaut bon marché. Le difficile — le code,
les agents, l’usage d’outils — mérite le panel complet.
Fan out to the panel
Chaque modèle tente sa chance d’un coup — des tentatives indépendantes qui rattrapent chacune
ce que les autres manquent.
Les panels
Trois panels choisis, de la pointe au budget. Appelez le slug — nous gardons les membres à jour pour que vous n’ayez pas à le faire.| Call it as | Panel | Best for |
|---|---|---|
orcarouter/fusion | Claude Opus 4.8 · GPT-5.5 · Gemini 3.1 Pro | Le raisonnement et le code les plus difficiles |
orcarouter/fusion-mini | Claude Opus 4.8 · GPT-5.5 | Un panel plus léger à deux modèles |
orcarouter/fusion-flash | Un panel budget de modèles moins chers | Fan-out sensible au coût |
Appelez-le
Fusion est compatible OpenAI — échangez le slug du modèle, tout le reste reste identique :Facturation
Un fan-out exécute chaque membre du panel plus le juge, donc une requête fanée est facturée comme la somme de ces complétions sous-jacentes — au prix coûtant, sans aucune marge — et uniquement sur les requêtes qui font réellement un fan-out. Les requêtes faciles retombent vers un défaut moins cher et sont facturées comme un seul appel. Chaque branche apparaît comme sa propre ligne dans vos journaux de requêtes, partageant une seule requête.Au-delà du preset
Les presets sont dubest_of_n sur un panel fixe. Le même moteur, rédigé en
DSL de routage, vous remet tout le graphe :
- Route by difficulty — ne faites un fan-out que sur les requêtes difficiles ; gardez « hi » sur un défaut bon marché pour ne jamais payer le prix du panel pour du bavardage.
- Swap the judge — choisissez le modèle arbitre, ou changez complètement de stratégie :
synthesizepour fusionner une réponse,tests_passpour garder le patch qui passe,majority, oufirst. - Build your own panel — n’importe quels modèles, n’importe quel nombre de branches, votre propre déclenchement.
- Cascade on a weak answer — réessayez avec un modèle plus fort quand le premier semble de faible confiance.
- Ship it like infra — passez un jeu de règles en shadow, faites-en un canary sur une tranche de trafic, et faites-en un dry-run contre une requête échantillon avant qu’il ne serve quiconque.
Composez votre propre panel
Choisissez les modèles, échangez le juge, et réglez exactement quand le panel se déclenche — tout
votre graphe de routage en quelques lignes de YAML.
