الانتقال إلى المحتوى الرئيسي
معظم الفرق تلجأ إلى أمان الوكيل متأخراً جداً ومستوى واحداً في كل مرة — regex على المطالبات هنا، قائمة منع أدوات هناك. النتيجة موقف بثغرات: فحص نص لا يرى أبداً shell.exec، أو جدار حماية أدوات لا يلاحظ أبداً رقم بطاقة ائتمان يغادر في مطالبة. أسرع طريق إلى خط أساس أمان وكيل كامل هو ضبط كلا المستويين دفعةً واحدة. تحكّم الاستقلالية في OrcaRouter — خط أساس الوكلاء الآمنين — يفعل ذلك بالضبط: مفتاح واحد على مستوى مساحة العمل يكتب سياسة جدار حماية وحاجز حماية معاً، في معاملة واحدة، مع تراجع بنقرة واحدة. لا تؤلّف قاعدة لتُحمَى؛ تختار مستوى وتضبط لاحقاً.
المستويان متكاملان، وليسا زائدين عن الحاجة. حواجز الحماية تفحص نص المطالبة/الاستجابة (PII، الأسرار، نية jailbreak والحقن)؛ وجدار الحماية يحكم الإجراءات التي يتخذها وكيل (أي أدوات، استدعاءات MCP، ومضيفون). أي منهما وحده يترك ثغرة يغلقها الآخر — انظر حواجز الحماية مقابل جدار الحماية.

1. لماذا خط أساس واحد يتفوّق على نصفي تدبير

تشغيل وكيل حقيقي يعبر كلا المستويين في طلب واحد. يقرأ النموذج مطالبة (نص)، يقرّر استدعاء db.query (إجراء)، ونتيجة الأداة تتغذّى عائدةً في الدور التالي (نص مجدداً). تأمين مستوى واحد فقط يترك الآخر غير محروس:

جدار الحماية فقط

ترفض shell المدمّر، لكن مطالبة لا تزال تحمل رقم ضمان اجتماعي لعميل مباشرةً إلى النموذج — ووسيطة أداة لا تزال تسرّب مفتاح API.

حواجز الحماية فقط

تخفي PII في المطالبات، لكن الوكيل لا يزال يستدعي rm -rf، أو يصل إلى نقطة نهاية بيانات تعريف سحابة، أو يدور على أداة منفلتة.
تحكّم الاستقلالية يزيل الخيار. مستوى واحد يضبط موقفاً متماسكاً عبر كلا المستويين، فلا توجد نافذة يكون فيها أحدهما مضبوطاً والآخر لا.

2. خط أساس أمان الوكيل: ثلاثة مستويات

كل مستوى يغطّي نفس المستويين. اختر واحداً؛ إنه أرضيتك، وتضيف دقة بقواعد لاحقاً.
المستوىجدار الحمايةحواجز الحمايةوضع observe
tightحجب افتراضي؛ shell المدمّر + الأدوات بهيئة الجلب مرفوضةPII Shield + Secrets Blocker مفروضانمطفأ
balancedتدقيق افتراضي؛ shell المدمّر مرفوضPII Shield بالتدقيق فقط (يعلّم PII)مطفأ
permissiveلا سياسة فارضةلا شيءمفعّل — يسجّل كل استدعاء كثغرة
بضع تفاصيل تستحق التثبيت، إذ تشكّل ما يصطاده كل مستوى فعلاً:
tight يختم الحكم الافتراضي لسياسة جدار الحماية بـ deny، ثم يطبّق قواعد deny لـ أسماء أدوات shell/exec التي تحمل أوامر مدمّرة — shell.*، bash، cmd، powershell، exec — ولـ أسماء الأدوات بهيئة الجلب التي تحمل SSRF — http_fetch، web_search، fetch_url، request (ومتغيراتها <server>.* المُسمّاة بنطاق MCP). يرفض أسماء الأدوات هذه؛ إنه لا يشحن قاعدة egress لـ CIDR أو بيانات تعريف سحابة. إذا أردت رفض 169.254.169.254 أو نطاقات RFC-1918 بالوجهة، ألّف قاعدة egress خاصة بك — انظر التحكم في egress.
حاجزا PII Shield وSecrets Blocker كلاهما نشط وفارض. PII Shield يخفي PII على الطلب قبل أن يصل إلى النموذج؛ وSecrets Blocker يصطاد الاعتمادات في الطلب. الأسرار في وسائط الأدوات يصطادها هذا الحاجز على الطلب — جدار الحماية لا يجرّدها افتراضياً.
balanced يدقّق كل شيء (حكم افتراضي audit) فـ ترى سلوك وكيلك الحقيقي، بينما لا يزال يرفض أكثر فئة مدمّرة واحدة — shell المدمّر. PII Shield يعمل في وضع التدقيق فقط (يعلّم PII، لا يحجب). تحصل على أثر كامل بلا خطر يُذكَر لحجب غير متوقّع، ثم تشدّد من الرؤية بدلاً من التخمين.
permissive يفرض لا شيء — يوجد لرصد وكيل جديد تماماً بصفر خطر حجوبات عرضية. يبقى وضع observe مفعّلاً، فكل استدعاء أداة لا يزال يُسجَّل كثغرة تغطية (مرئية في الأدوات المكتشفة). استخدمه لتعلّم شكل وكيل، ثم انتقل إلى balanced أو tight.

3. مثال ملموس واحد: طبّق balanced، راقب التغذيتين

تطبيق مستوى إجراء وحدة تحكم واحد (Firewall → Posture) أو استدعاء API واحد. المسار يعمل تحت جلستك ويتطلب Developer+.
# Configure in the console, or POST under your session token (Developer+):
POST /api/workspace/firewall/autonomy
Content-Type: application/json

{ "level": "balanced" }
تحمل الاستجابة audit_id — احتفظ به؛ إنه ما تمرّره للتراجع. بمجرد التطبيق، خط الأساس حي في استدعاء الأداة التالي. لا إعادة نشر، لا تغيير في كود الوكيل. الآن تراقب كلا المستويين دفعةً واحدة:
  • Firewall → Events — كل حكم استدعاء أداة (audit، استدعاءات shell المدمّر المرفوضة). انظر سجل الأحداث.
  • Guardrails → Matches — كل إصابة سياسة محتوى (علامات PII Shield).
لأن balanced يكتب سياسة جدار حماية حقيقية قابلة للتحرير وحاجز حماية حقيقياً (كل منهما مسمّى للمستوى)، يمكنك فتح أي منهما بعدها وضبطه — خط الأساس نقطة بداية، وليس إعداداً مسبقاً مقفلاً.
عاين قبل أن تلتزم. GET /api/workspace/firewall/simulate?level=tight (Member، للقراءة فقط) يُظهر بالضبط ما كان tight سيغيّره مقابل حالتك الحالية — لا شيء يُطبَّق. أجره بعد يوم أو يومين على balanced لتأكيد أن tight لن يرفض استدعاءات هي جزء من حركة مرورك الطبيعية.

4. التراجع استدعاء واحد

كل تغيير استقلالية قابل للعكس من لقطة تدقيقه، يستعيد الحالة السابقة بالضبط — السياسات، القواعد، حواجز الحماية، والإعدادات — وليس إعادة ضبط عامة.
# Developer+; :audit_id is the value returned when you applied the level.
POST /api/workspace/firewall/autonomy/undo/:audit_id
لمساحة عمل كبيرة جداً لقطتها تتجاوز حد حجم سجل التدقيق، لا يزال التطبيق ينجح لكن التراجع بنقرة واحدة غير متاح لذلك التغيير — تعيد تطبيق المستوى الذي تريده بدلاً من ذلك. هذا نادر، لكنه يستحق المعرفة قبل أن تشدّد مساحة عمل إنتاج مزدحمة.

5. المسار الموصى به

ابدأ عريضاً، راقب، ثم شدّد من موقع رؤية:
1

طبّق balanced

أثر تدقيق كامل؛ فقط shell المدمّر مرفوض؛ PII مُعلَّم. شغّل وكلاءك طبيعياً ليوم أو يومين.
2

حاكِ tight

GET /api/workspace/firewall/simulate?level=tight وقارن رفضاته بما أظهرته تغذية الأحداث فعلاً. إذا كانت الاستدعاءات بهيئة الجلب أو shell المدمّر جزءاً من تدفّقك الطبيعي، أصلح الوكيل أولاً.
3

طبّق tight

بمجرد ألّا تحمل المحاكاة مفاجآت، بدّل إلى tight. التراجع استدعاء واحد إن انكسر الإنتاج.
4

اضبط بقواعد

خط الأساس أرضيتك. انحت استثناءات أو أضف عناصر تحكم لا يغطّيها بـ قواعد جدار الحماية و حواجز حماية مسمّاة. اربط سياسة أو حاجز حماية محدداً بمفتاح فردي لنطاق أدق.

6. الأدوار لخط الأساس المدموج

تحكّم الاستقلالية يمتد عبر كلا المستويين، لكن كل إجراء محكوم بالدور.
الإجراءالدور الأدنى
محاكاة مستوى / عرض Matches حواجز الحماية / عرض الأدوات المكتشفةMember
عرض Events وRuns جدار الحمايةDeveloper+
تطبيق مستوى استقلاليةDeveloper+
التراجع عن تغيير استقلاليةDeveloper+
كل الضبط يعمل في وحدة التحكم تحت جلستك (/api/workspace/firewall/* و /api/guardrail/*). فقط استدعاءات ترحيل /v1/* تستخدم مفتاح sk-orca-…؛ مسارات مفتاح البوابة نطاق منفصل. انظر النطاق: المفاتيح، السياسات، مساحات العمل.

7. بعد خط الأساس: أين تضبط كل مستوى

خط الأساس يحميك في أول 30 دقيقة. من هناك، لكل مستوى مرجعه الخاص للعمل الدقيق:

نظرة عامة على جدار الحماية

الأحكام، الأسطح، عبارات الوسائط، الموافقات — مستوى الإجراء.

حواجز الحماية

قواعد الكلمة المفتاحية، regex، PII، llm_judge، والتأريض — مستوى المحتوى.

وضع الظل

اطرح سياسة جدار حماية مشدَّدة بالتدقيق فقط قبل الفرض.

خط أساس الوكلاء الآمنين

صفحة المفهوم لتحكّم الاستقلالية ودلالات تراجعه.
خط الأساس هو الأرضية التي تغلق كلا المستويين دفعةً واحدة؛ والقواعد هي كيف ترفع السقف. انظر تأمين وكلاء الذكاء الاصطناعي و مجموعة التحكم لكيفية تركّب الطبقات، و الوكالة المفرطة للتهديد الذي يجيب عليه هذا الخط الأساس بشكل أكثر مباشرة.