Como funciona
Route by difficulty
Conversa casual vai direto para um default barato. As coisas difíceis —
código, agentes, uso de ferramentas — ganham o painel completo.
Fan out to the panel
Cada modelo dá sua tacada de uma vez — tentativas independentes que captam,
cada uma, o que as outras deixam passar.
Os painéis
Três painéis curados, de fronteira a econômico. Chame o slug — mantemos os membros atualizados para que você não precise.| Call it as | Panel | Best for |
|---|---|---|
orcarouter/fusion | Claude Opus 4.8 · GPT-5.5 · Gemini 3.1 Pro | Raciocínio e código mais difíceis |
orcarouter/fusion-mini | Claude Opus 4.8 · GPT-5.5 | Um painel enxuto de dois modelos |
orcarouter/fusion-flash | Um painel econômico de modelos mais baratos | Fan-out sensível a custo |
Chame-o
O Fusion é compatível com OpenAI — troque o slug do modelo, todo o resto permanece igual:Cobrança
Um fan-out roda cada membro do painel mais o juiz, então uma requisição com fan-out é cobrada como a soma dessas completions subjacentes — a custo, zero markup — e apenas nas requisições que realmente fazem fan-out. Requisições fáceis caem para um default mais barato e são cobradas como uma única chamada. Cada perna aparece como sua própria linha nos seus logs de requisição, compartilhando uma requisição.Além do preset
Os presets sãobest_of_n sobre um painel fixo. O mesmo mecanismo, escrito como
Routing DSL, entrega a você o grafo inteiro:
- Route by difficulty — faça fan-out apenas nas requisições difíceis; mantenha “oi” em um default barato para que você nunca pague preço de painel por conversa fiada.
- Swap the judge — escolha o modelo árbitro, ou mude a estratégia por
completo:
synthesizepara fundir uma resposta,tests_passpara manter o patch que passa,majorityoufirst. - Build your own panel — quaisquer modelos, qualquer número de pernas, seu próprio gating.
- Cascade on a weak answer — tente novamente com um modelo mais forte quando a primeira resposta parecer de baixa confiança.
- Ship it like infra — coloque um conjunto de regras em shadow, faça canary dele sobre uma fatia do tráfego e faça dry-run contra uma requisição de amostra antes de servir qualquer pessoa.
Componha o seu próprio painel
Escolha os modelos, troque o juiz e defina exatamente quando o painel dispara —
todo o seu grafo de roteamento em algumas linhas de YAML.
