Chaque étape ici est une action de console sur la passerelle hébergée
(
api.orcarouter.ai). La configuration des guardrails s’exécute sous votre
propre session ; seul l’appel /v1/* final utilise une clé de relais
sk-orca-.... Créer et modifier des guardrails nécessite Developer+ dans
l’espace de travail.1. Comment ajouter des guardrails LLM en cinq étapes
Voici toute la boucle en un coup d’œil — chaque étape est développée ci-dessous.Créer un guardrail
Dans la console, ouvrez Guardrails et cliquez sur New guardrail.
Donnez-lui un nom (≤ 64 caractères), par exemple
pii-shield.La tester dans le sandbox
Ouvrez l’onglet Test, collez un échantillon, et exécutez la politique
localement — aucun appel en amont, aucun quota.
L'attacher à une clé
Modifiez une clé API et choisissez le guardrail dans la liste déroulante
Guardrail. La liaison vit sur la clé.
2. Créer le guardrail
Dans la console, ouvrez Guardrails et cliquez sur New guardrail. Un guardrail est une politique de contenu nommée, à portée d’espace de travail — une liste ordonnée de règles que la passerelle exécute contre l’entrée de la requête et la sortie du modèle. Nommez-lepii-shield et
enregistrez.
3. Ajouter une règle
Chaque règle décide trois choses — quoi rechercher (un type de règle), où chercher (une étape), et quoi faire (une action). Ajoutez une règle :- Type : PII detection (
pii) - Étape : Input (la requête)
- Action : Mask — redacter la correspondance
- Entités :
email,phone,ssn
[EMAIL], un SSN devient [SSN]. Les sept types de
règles (keyword, regex, pii, max_chars, external, llm_judge,
grounding) et les cinq actions (block, mask, flag, annotate,
spotlight) sont couverts dans la
référence. Pour ce premier guardrail,
une seule règle de masquage suffit.
Le masquage est actif sur les deux étapes. Les règles à l’étape input
masquent la requête avant que le modèle ne la voie ; les règles à l’étape
output masquent la réponse du modèle — sur les réponses non-streaming et
chunk par chunk sur les réponses streaming — avant que le client ne la reçoive.
Block est appliqué sur les deux étapes également. Si vous voulez contrôler
les réponses du modèle, définissez l’étape de la règle sur
output (ou
both) ; voir Règles à l’étape output.4. La tester dans le sandbox
Avant d’attacher le guardrail à une clé, prouvez qu’il fait ce que vous attendez. Ouvrez l’onglet Test à l’intérieur de l’éditeur, collez un échantillon, choisissez l’étapeinput, et lancez :
5. L’attacher à une clé
Un guardrail ne fait rien tant qu’une clé ne pointe pas vers lui. Deux façons de lier :Par clé
Modifiez une clé API et choisissez le guardrail dans la liste déroulante
Guardrail. Cela définit
guardrail_id sur la clé. Voir
Attacher à une clé.Défaut de l'espace de travail
Marquez le guardrail comme défaut de l’espace de travail afin que
toute clé sans attachement explicite en hérite. Voir
Défaut de compte.
| Ordre | Ce qui s’applique |
|---|---|
| 1 | Le guardrail_id explicite de la clé (s’il existe et est activé). |
| 2 | Le défaut de l’espace de travail (si la clé n’a pas d’attachement). |
| 3 | Aucun — la requête est identique octet pour octet à un espace de travail sans politique. |
6. Envoyer une requête
En utilisant une clé liée àpii-shield, appelez OrcaRouter exactement comme
avant — aucun changement de SDK, aucun nouvel en-tête :
[EMAIL] avant la transmission — le modèle en
amont ne voit jamais l’adresse. Basculez l’action de la règle sur block et
la toute prochaine requête contenant l’entité est rejetée avec une HTTP
400 guardrail_blocked. Une requête bloquée ne coûte aucun quota (un
block input se déclenche avant la mesure ; un block output rembourse le quota
pré-consommé) et est marquée skip-retry. Voir
l’erreur guardrail_blocked
pour la forme complète de la réponse.
7. Où aller ensuite
Voir ce qui s'est déclenché
Voir ce qui s'est déclenché
Chaque règle qui se déclenche enregistre une correspondance — type,
action, étape et une chaîne de détail. La sous-chaîne correspondante n’est
enregistrée que lorsque Log raw content est activé (désactivé par
défaut). Voir le
flux des correspondances et
Journalisation & confidentialité.
Masquer au-delà des bases
Masquer au-delà des bases
La détection de PII couvre
email, phone, credit_card, ssn, ip,
iban, mac_address, jwt, aws_access_key, api_key_openai,
bitcoin_address (plus les entités régionales), et vous pouvez rédiger
les vôtres. Voir PII Shield,
Entités PII personnalisées, et
Formats de masquage.Attraper les secrets et l'injection
Attraper les secrets et l'injection
Ajoutez un bloqueur de secrets ou
le preset Bases de l’injection de prompt
— ce dernier signale les phrases de jailbreak courantes pour revue. Pour
attraper l’intention d’injection sémantiquement plutôt que par phrase,
ajoutez une règle
llm_judge à côté.Annuler un changement
Annuler un changement
Chaque modification écrit une ligne d’historique de versions. Ouvrez
History pour faire le diff et revenir en arrière. Voir
Versioning.
Contrôler les appels d'outils, pas seulement le texte
Contrôler les appels d'outils, pas seulement le texte
Les guardrails filtrent le contenu. Pour gouverner les appels d’outils
d’un agent — refuser les actions destructrices, plafonner le coût, exiger
une approbation — utilisez le Firewall. Commencez
par Sécuriser les agents IA et
la menace des appels d’outils dangereux.
