الانتقال إلى المحتوى الرئيسي
أي مطالبة يرسلها تطبيقك إلى نموذج يمكن أن تحمل بيانات شخصية لا ينبغي أن تحملها — بريد إلكتروني لُصق في تذكرة دعم، أو رقم ضمان اجتماعي في ملاحظة CRM، أو رقم بطاقة كتبه مستخدم في صندوق محادثة. وبمجرد أن يصل ذلك النص إلى مزوّد أعلى، يخرج عن سيطرتك: يُسجَّل، ويُخبَّأ، وربما يُستخدم للتدريب. وردّ النموذج يمكن أن يسرّب PII مرة أخرى أيضاً، مردّداً أو مستنتجاً تفاصيل تنتهي عندئذٍ في سجلات تطبيقك. تُظهر هذه الصفحة كيف توقف تسرّب llm pii عند البوابة باستخدام حاجز حماية PII — قاعدة ضمن نطاق مساحة العمل تُخفي أو تحجب الكيانات الحساسة على الطلب قبل أن يراها النموذج. إنه النظير على مستوى المحتوى لـجدار حماية الوكيل، ولا يحتاج إلى أي تغيير في كود تطبيقك.
يفحص حاجز حماية PII نص المطالبات والاستجابات. ولحُكم الإجراءات التي يتخذها الوكيل بالبيانات — أدوات الجلب، ومضيفي egress — انظر تسريب البيانات. المستويان يتكاملان؛ معظم الفرق تشغّل كليهما.

1. كيف يحدث الكشف

يصل PII إلى مزوّد أعلى عبر حركة مرور عادية حسنة النية:
  • يلصق مستخدم تفاصيل اتصاله الخاصة في محادثة فيمرّر تطبيقك الرسالة كاملةً حرفياً.
  • يسترجع خط أنابيب RAG مستنداً يحتوي على سجلات عملاء ويحشره في المطالبة كسياق.
  • يقرأ وكيل صفاً من قاعدة بيانات ويضمّن حقولاً خام في وسيط أداة أو في مطالبة لاحقة.
  • يستجيب النموذج فيعيد صياغة أو يستنتج PII، فيكتبه تطبيقك عندئذٍ في سجلاته الخاصة.
لا شيء من هذا هجوم — إنها الشكل الطبيعي لتطبيقات LLM. والإصلاح هو سياسة تفحص كل طلب واستجابة عند نقطة اختناق واحدة، بدلاً من تدقيق كل موضع استدعاء في كودك.

2. ادفع تسرّب llm pii بحاجز حماية PII

حاجز الحماية هو سياسة محتوى مسمّاة ضمن نطاق مساحة العمل. قاعدة pii داخله تكتشف الكيانات الحساسة وتطبّق إجراءً واحداً على كل مطابقة:
الإجراءالأثر
maskاستبدل كل مطابقة بوسم مكتوب — jane@acme.com[EMAIL] — ومرّر النص المنظَّف. لا يرى النموذج الأصل أبداً.
blockارفض الطلب بأكمله بـ HTTP 400 guardrail_blocked. استخدمه عندما يجب ألا يصل PII إلى المزوّد أبداً على الإطلاق.
flagلا تغيّر شيئاً في حركة المرور؛ سجّل مطابقة. قِس الكشف قبل أن تفرض.
مجموعة الكاشف مدمجة وحتمية — مطابقة أنماط محضة، بلا استدعاء شبكة، آمنة على المسار الساخن. الكيانات المدمجة: email وphone وcredit_card وssn وip وiban وmac_address وjwt وaws_access_key وapi_key_openai وbitcoin_address، إضافةً إلى المعرّفات الإقليمية المحكومة بمجموع تحقّق jp_mynumber وkr_rrn وcn_resident_id. في إجراء mask تُعرَض كل مطابقة كوسمها المكتوب — [EMAIL] و[SSN] و[CREDIT_CARD] وهكذا — فتبقى بنية المطالبة بينما تختفي القيمة.
تحتاج إلى كاشف ليس مدمجاً (معرّف موظف داخلي، أو رقم حساب)؟ أضف كياناً مخصّصاً — تعبيراً نمطياً مع مجموع تحقّق Luhn اختياري، حتى 25 لكل قاعدة — جنباً إلى جنب مع المدمجة. انظر مرجع حواجز الحماية.

3. مثال ملموس — إخفاء PII على الطلب

أسرع بداية هي الإعداد المسبق PII Shield: قاعدة pii واحدة تُخفي email وphone وssn وcredit_card وip. اضبطه في وحدة التحكم — بلا تغييرات في الكود، بلا مفتاح في هذه الخطوة.
1

أنشئ حاجز الحماية

في وحدة التحكم، افتح Guardrails وانقر New guardrail. اختر الإعداد المسبق PII Shield من فئة pii، أو ألّف يدوياً قاعدة pii واحدة بإجراء mask على الكيانات أعلاه. احفظ. (تتطلب الكتابات دور Developer أو أعلى.)
2

أثبته في صندوق الرمل

افتح تبويب Test، الصق “reply to jane@acme.com، اختر مرحلة input، وشغّل. يعيد صندوق الرمل reply to [EMAIL] — محلياً، بلا استدعاء أعلى وبلا إنفاق حصة.
3

اربطه بمفتاح

في API Keys، حرّر مفتاحاً واختر حاجز الحماية من قائمة Guardrail المنسدلة، أو اضبط حاجز الحماية كافتراضي لمساحة العمل بحيث يرثه كل مفتاح غير مربوط. يعيش الربط على المفتاح في البوابة.
4

استدعِ البوابة كالمعتاد

باستخدام ذلك المفتاح، يبقى استدعاء الترحيل دون تغيير:
curl https://api.orcarouter.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-orca-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-4o-mini",
    "messages": [
      {"role": "user", "content": "Draft a reply to jane@acme.com"}
    ]
  }'
تعيد البوابة كتابة البريد إلى [EMAIL] قبل التمرير. لا يستلم النموذج الأعلى العنوان أبداً.
PII Shield قاعدة بمرحلة both، لكن إخفاء مرحلة الطلب الحيّ هو ما يُطرح اليوم — تُخفي البوابة المطالبة قبل أن تغادر إلى النموذج. أما إخفاء مرحلة الإخراج (الاستجابة) على الترحيل الحيّ فعلى خارطة الطريق. للتحقق من سلوك قاعدة في مرحلة الإخراج، قيّمها في تبويب Test. أما التدفّق فانظر §5.

4. أخفِ الأغلب، احجب الأسوأ — تجاوزات لكل كيان

يمكن لقاعدة واحدة أن تطبّق إجراءات مختلفة على كيانات مختلفة عبر entity_actions. أخفِ المعرّفات منخفضة الخطر لكن احجب بصرامة الكيانات التي لا تريد تمريرها أبداً — قاعدة واحدة بدلاً من ثلاث متداخلة:
{
  "type": "pii",
  "stage": "input",
  "action": "mask",
  "entities": ["email", "phone", "ip", "credit_card", "ssn"],
  "entity_actions": {
    "credit_card": "block",
    "ssn": "block"
  }
}
هنا تُخفى عناوين البريد والهواتف وعناوين IP وتمرّ؛ أما مطالبة تحمل رقم بطاقة أو رقم ضمان اجتماعي فتُرفض بـ HTTP 400 guardrail_blocked بدلاً من ذلك. الطلب المحجوب لا يكلّف أي حصة — يُطلق حجب مرحلة الإدخال قبل القياس — ويُعلَّم skip-retry. كل مفتاح entity_actions يجب أن يكون كياناً معلَناً على القاعدة (مدمجاً أو مخصّصاً)؛ ويُتحقَّق من إجرائه مقابل مجموعة إجراءات القاعدة.

5. ما الذي يعمل على التدفّق اليوم

يتفاعل الإجراء والمرحلة مع التدفّق بشكل مختلف — اعرف المصفوفة قبل أن تعتمد عليها:
حيّ بالكامل. تُفحص المطالبة قبل الاستدعاء الأعلى، فيعمل الإخفاء والحجب بشكل متطابق سواء أكانت الاستجابة تتدفّق أم لا. هذا هو السطح الذي يفرضه PII Shield اليوم.
يُفرَض على الاستجابات المتدفّقة وغير المتدفّقة. على التدفّق، يقطع ماسحٌ التدفّق في منتصف الطيران ويُصدر رسالة بديلة قبل أن يصل أي محتوى محجوب إلى العميل؛ يردّ حجب الإخراج الحصة المُستهلَكة مسبقاً.
حالياً غير متدفّق فقط. على استجابة متدفّقة تمرّ الكتلة الأصلية دون إخفاء — وإعادة كتابة التدفّق داخل النطاق تحسينٌ مخطّط له. لإخفاء الاستجابة اليوم، استخدم طلبات غير متدفّقة، أو اعتمد على إخفاء مرحلة الإدخال. أثبت تركيبتك الدقيقة من المرحلة/التدفّق في تبويب Test أولاً.

6. شاهد ما الذي التُقط

كل قاعدة تُطلق تسجّل مطابقة — نوعها، وإجراؤها، ومرحلتها، وسلسلة تفصيل — مرئية على تغذية Matches لمساحة العمل (GET /api/guardrail/match، مفتوحة لأي عضو). من هناك يمكنك التجميع، والتصفية، والتصدير إلى CSV، ووسم الإيجابيات الكاذبة.
لا تُسجَّل القيم الخام افتراضياً. مفتاح Log raw content لحاجز الحماية مطفأ — الموقف المحافظ على الخصوصية — فتسجّل تغذية Matches أن قاعدة PII أُطلقت وأي كيان، لكن ليس السلسلة الفرعية المطابقة (عنوان البريد نفسه). فعّله لكل حاجز حماية فقط عندما تحتاج القيمة للفرز؛ الإعداد غير رجعي. التقاط PII في مسار تدقيقك الخاص لتصحيح تسرّب PII سيكون هزيمةً لذاته.

7. خذها أبعد

للحصول على ضوابط الإقامة، والاحتفاظ، والحق في المحو الكاملة — بما في ذلك تثبيت حزمة امتثال تُجسّد حواجز الحماية هذه لـ GDPR أو HIPAA أو PCI DSS — ابدأ من صفحات المرجع أدناه.

مرجع حواجز الحماية

كل نوع قاعدة، ومرحلة، وإجراء، والكيانات المخصّصة، والإصدارات، وأداة التقييم — المرجع العميق وراء هذه الصفحة.

تسريب الأسرار

الشقيق على شكل بيانات اعتماد — رموز AWS وOpenAI وGitHub — تلتقطها حاجز حماية Secrets Blocker.

المخرجات غير الآمنة

فحص ما يرسله النموذج، وليس فقط ما يستقبله.

حواجز الحماية مقابل جدار الحماية

متى تفحص النص ومتى تحكم الإجراءات — ولماذا تريد كليهما عادةً.