Saltar al contenido principal
Un guardrail demasiado entusiasta es peor que no tener guardrail — tu equipo aprende a ignorar el feed de Matches, o aflojas la regla y pierdes la captura que realmente querías. OrcaRouter te da un camino intermedio preciso: marca una sola coincidencia como falso positivo, y el motor recuerda ese hallazgo y se lo salta en solicitudes futuras — sin tocar la regla, sin aflojar el patrón ni lanzar un cambio de SDK. Este es un aterrizaje enfocado para el flujo de falsos positivos. Para el motor de guardrails completo — cada tipo de regla, campo y ruta — ver la referencia de Guardrails.
Cada paso aquí es una acción de consola sobre el gateway alojado (api.orcarouter.ai). Triagas coincidencias bajo tu propia sesión; solo la llamada final /v1/* usa una clave de relay sk-orca-.... Marcar una coincidencia como falso positivo requiere el rol Admin del espacio de trabajo; leer el feed de Matches y la lista de supresión resultante está abierto a cada miembro.

1. Reduce los falsos positivos de guardrail sin debilitar la regla

El instinto cuando una regla se sobre-dispara es aflojarla — ampliar una exclusión de regex, quitar una entidad, cambiar block a flag. Eso intercambia un falso positivo por un agujero en la política. La supresión por marcar-falso-positivo es la alternativa quirúrgica:

Suprime un hallazgo

Silencia la coincidencia exacta que falló — una subcadena específica bajo una regla específica — no toda la regla. El siguiente acierto genuinamente sensible todavía se dispara.

Sin edición de regla, sin redespliegue

La supresión vive en el gateway como memoria del espacio de trabajo. La regla permanece exactamente como se escribió; tu app sigue llamando a /v1/* sin cambios.

Memoria a nivel de todo el espacio de trabajo

Un Admin la marca una vez; la supresión se deduplica a través del espacio de trabajo, así que el tráfico de cada miembro se beneficia — sin fan-out por clave.

Reversible

Des-marca la coincidencia (o elimina la supresión) y el hallazgo se dispara de nuevo en la siguiente solicitud. Nada se destruye.
La supresión es para un hallazgo que has juzgado benigno. Si toda una regla está mal calibrada — forma incorrecta, etapa incorrecta — arregla la regla y pruébala en el arnés de Eval en vez de silenciar coincidencia tras coincidencia.

2. Cómo una coincidencia se convierte en una supresión

Cada regla que se dispara registra una coincidencia en el Feed de coincidencias del espacio de trabajo — tipo de regla, acción, etapa y una cadena de detalle. Cuando marcas una de esas coincidencias como falso positivo, el gateway deriva una huella estable para el hallazgo y la escribe en la lista de supresión del espacio de trabajo. En cada solicitud futura, el motor verifica la huella de cada hallazgo contra esa lista y se salta uno suprimido antes de que pueda bloquear, enmascarar o marcar. Dos tipos de hallazgo producen una huella:
Un hallazgo de CVE / SBOM ya viene con una identidad estable — la identidad del aviso o componente viaja con el hallazgo. Suprimir uno silencia ese CVE/componente exacto, y solo ese. Este es el caso nativo para el que se construyó el almacén de supresión.
Keyword, regex, PII y los otros tipos de regla deterministas no llevan una identidad propia, así que el gateway sintetiza una a partir de datos que son idénticos en el lado de escritura (tu clic de mark-FP) y el lado de aplicación (la siguiente solicitud): el guardrail, la identidad de coincidencia de la regla y — cuando la captura en bruto está activada — las propias subcadenas coincidentes.
La precisión de la huella sintética depende de Log raw content, que está apagado por defecto. Con la captura encendida, la huella se basa en la subcadena coincidente exacta, así que suprimir ORD-48291507 silencia ese número de pedido y nada más. Con la captura apagada, no hay subcadena en la que basarse, así que la supresión cae a un silenciado a nivel de regla — silencia esa única regla (en esa etapa) para el espacio de trabajo. El fallback nunca alcanza más allá de la regla de la que vino. Ver Registro y privacidad.

3. Un ejemplo concreto

Digamos que ejecutas una regla regex que enmascara números de pedido internos con forma de ORD- más ocho dígitos. Un ticket de soporte cita legítimamente ORD-48291507 de una forma que has decidido que está bien dejar pasar. No quieres debilitar la regla — solo quieres que este número deje de dispararse.
1

Abre el feed de Matches

En la consola, abre Guardrails → Matches. Filtra por guardrail y tipo de regla para encontrar la fila del acierto ORD-48291507. (Para ver la subcadena literal, el Log raw content del guardrail debe haber estado activado cuando la coincidencia se registró — está apagado por defecto.)
2

Márcala como falso positivo

Abre el detalle de la coincidencia y elige Mark as false positive. Como Admin del espacio de trabajo, esto sella la coincidencia y refleja una supresión del espacio de trabajo basada en la huella del hallazgo.
3

Confirma que está suprimida

Abre la lista de Suppressions — la nueva entrada aparece, etiquetada con el guardrail y la regla de la que vino y la razón “Marked as false positive from Matches”. Cada miembro del espacio de trabajo puede leer esta lista.
4

Envía la misma solicitud de nuevo

Usando tu clave de relay, llama a OrcaRouter exactamente como antes — sin nuevas cabeceras, sin cambio de SDK:
curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "Status of order ORD-48291507?"}
    ]
  }'
El hallazgo suprimido se salta — ORD-48291507 pasa — mientras que cualquier otro número de pedido todavía coincide y se enmascara como antes.

4. Supresión vs. las alternativas

La supresión es una de cuatro formas de silenciar una regla ruidosa. Elige la más estrecha que encaje:
EnfoqueQué cambiaCuándo recurrir a ello
Mark FPUn hallazgo (o una regla, captura-apagada)Un acierto benigno específico; la regla por lo demás está bien
Editar la reglaLa coincidencia en síForma/etapa incorrecta — arréglala, luego re-evalúa
Acción flagSolo observar, sin bloquearUna regla nueva en la que aún no confías
Arnés de EvalNada en vivo — mideProbar precisión antes de lanzar
No tapes una regla sistemáticamente incorrecta marcando FP tras FP. Si estás suprimiendo la misma forma repetidamente, la regla está mal calibrada — ancla el regex, acota la lista de keywords, o elige una entidad PII más ajustada, y verifica con una ejecución de eval.

5. Revertir una supresión

Nada aquí es de un solo sentido:
  • Des-marca la coincidencia — la misma acción de Admin, invertida, quita el sello FP de la coincidencia y (cuando ninguna otra coincidencia marcada-FP todavía mapea a ella) elimina la supresión. El hallazgo se dispara de nuevo en la siguiente solicitud.
  • Elimina la supresión directamente — desde la lista de Suppressions, una acción Developer+ quita la entrada. Mismo efecto: el hallazgo está en vivo de nuevo.
Como las supresiones son memoria del espacio de trabajo, revertir una restaura la captura para el tráfico de cada miembro a la vez — igual que cómo marcarla la suprimió para todos.

6. Superficie de API

Estas son rutas de consola, autenticadas por tu sesión — no claves de relay. Restringe por rol cada acción: marcar una coincidencia FP es Admin; las lecturas de supresión son Member; las escrituras de supresión son Developer+.
Método y rutaRolPropósito
GET /api/guardrail/matchMemberLista coincidencias para triagar.
POST /api/guardrail/match/:id/mark-fpAdminMarca una coincidencia como falso positivo (refleja una supresión).
DELETE /api/guardrail/match/:id/mark-fpAdminDes-marca — restaura el hallazgo.
GET /api/guardrail/suppressionsMemberLista las supresiones activas del espacio de trabajo.
POST /api/guardrail/suppressionsDeveloper+Añade una supresión directamente.
DELETE /api/guardrail/suppressions/:idDeveloper+Quita una supresión.
Los endpoints mark-FP están rate-limited — son una acción de triaje deliberada y de bajo volumen, no una API masiva. Recurre al arnés de Eval, no a un bucle de llamadas mark-FP, cuando estés afinando toda una política.

7. Dónde ir a continuación

Feed de coincidencias

Donde cada regla disparada aterriza — el lugar desde el que triagas antes de marcar nada.

Pruebas y eval

Prueba la precisión de una regla contra un corpus antes de lanzarla — el arreglo sistemático cuando la supresión está tratando un síntoma.

Registro y privacidad

Cómo Log raw content controla si la supresión se basa en la subcadena exacta o cae a un silenciado a nivel de regla.

Referencia de Guardrails

El motor completo — cada tipo de regla, acción y ruta.
La supresión gobierna hallazgos de contenido. Para silenciar una regla ruidosa del agent firewall — una coincidencia de herramienta que has juzgado segura — esa es una superficie separada; ver el Firewall y su feed de anomalías. Para entender dónde se dividen los guardrails y el firewall, lee Guardrails vs Firewall.