shell.exec، أو جدار حماية أدوات لا يلاحظ أبداً رقم بطاقة ائتمان
يغادر في مطالبة.
أسرع طريق إلى خط أساس أمان وكيل كامل هو ضبط كلا المستويين دفعةً واحدة.
تحكّم الاستقلالية في OrcaRouter — خط أساس الوكلاء الآمنين — يفعل ذلك
بالضبط: مفتاح واحد على مستوى مساحة العمل يكتب سياسة جدار حماية
وحاجز حماية معاً، في معاملة واحدة، مع تراجع بنقرة
واحدة. لا تؤلّف قاعدة لتُحمَى؛ تختار مستوى وتضبط لاحقاً.
المستويان متكاملان، وليسا زائدين عن الحاجة. حواجز الحماية تفحص نص
المطالبة/الاستجابة (PII، الأسرار، نية jailbreak والحقن)؛ وجدار الحماية
يحكم الإجراءات التي يتخذها وكيل (أي أدوات، استدعاءات MCP، ومضيفون). أي منهما
وحده يترك ثغرة يغلقها الآخر — انظر
حواجز الحماية مقابل جدار الحماية.
1. لماذا خط أساس واحد يتفوّق على نصفي تدبير
تشغيل وكيل حقيقي يعبر كلا المستويين في طلب واحد. يقرأ النموذج مطالبة (نص)، يقرّر استدعاءdb.query (إجراء)، ونتيجة الأداة تتغذّى عائدةً في الدور التالي
(نص مجدداً). تأمين مستوى واحد فقط يترك الآخر غير محروس:
جدار الحماية فقط
ترفض shell المدمّر، لكن مطالبة لا تزال تحمل رقم ضمان اجتماعي لعميل مباشرةً
إلى النموذج — ووسيطة أداة لا تزال تسرّب مفتاح API.
حواجز الحماية فقط
تخفي PII في المطالبات، لكن الوكيل لا يزال يستدعي
rm -rf، أو يصل إلى
نقطة نهاية بيانات تعريف سحابة، أو يدور على أداة منفلتة.2. خط أساس أمان الوكيل: ثلاثة مستويات
كل مستوى يغطّي نفس المستويين. اختر واحداً؛ إنه أرضيتك، وتضيف دقة بقواعد لاحقاً.| المستوى | جدار الحماية | حواجز الحماية | وضع observe |
|---|---|---|---|
tight | حجب افتراضي؛ shell المدمّر + الأدوات بهيئة الجلب مرفوضة | PII Shield + Secrets Blocker مفروضان | مطفأ |
balanced | تدقيق افتراضي؛ shell المدمّر مرفوض | PII Shield بالتدقيق فقط (يعلّم PII) | مطفأ |
permissive | لا سياسة فارضة | لا شيء | مفعّل — يسجّل كل استدعاء كثغرة |
ماذا يرفض `tight` على مستوى الإجراء
ماذا يرفض `tight` على مستوى الإجراء
tight يختم الحكم الافتراضي لسياسة جدار الحماية بـ deny، ثم يطبّق
قواعد deny لـ أسماء أدوات shell/exec التي تحمل أوامر مدمّرة —
shell.*، bash، cmd، powershell، exec — ولـ أسماء الأدوات
بهيئة الجلب التي تحمل SSRF — http_fetch، web_search، fetch_url،
request (ومتغيراتها <server>.* المُسمّاة بنطاق MCP). يرفض أسماء
الأدوات هذه؛ إنه لا يشحن قاعدة egress لـ CIDR أو بيانات تعريف سحابة.
إذا أردت رفض 169.254.169.254 أو نطاقات RFC-1918 بالوجهة، ألّف قاعدة
egress خاصة بك — انظر التحكم في egress.ماذا يفرض `tight` على مستوى المحتوى
ماذا يفرض `tight` على مستوى المحتوى
حاجزا PII Shield وSecrets Blocker كلاهما نشط وفارض. PII Shield
يخفي PII على الطلب قبل أن يصل إلى النموذج؛ وSecrets Blocker يصطاد
الاعتمادات في الطلب. الأسرار في وسائط الأدوات يصطادها هذا الحاجز على
الطلب — جدار الحماية لا يجرّدها افتراضياً.
لماذا `balanced` هو البداية الموصى بها
لماذا `balanced` هو البداية الموصى بها
balanced يدقّق كل شيء (حكم افتراضي audit) فـ ترى سلوك وكيلك الحقيقي،
بينما لا يزال يرفض أكثر فئة مدمّرة واحدة — shell المدمّر. PII Shield يعمل
في وضع التدقيق فقط (يعلّم PII، لا يحجب). تحصل على أثر كامل بلا خطر يُذكَر
لحجب غير متوقّع، ثم تشدّد من الرؤية بدلاً من التخمين.3. مثال ملموس واحد: طبّق balanced، راقب التغذيتين
تطبيق مستوى إجراء وحدة تحكم واحد (Firewall → Posture) أو استدعاء API واحد.
المسار يعمل تحت جلستك ويتطلب Developer+.
audit_id — احتفظ به؛ إنه ما تمرّره للتراجع. بمجرد
التطبيق، خط الأساس حي في استدعاء الأداة التالي. لا إعادة نشر، لا تغيير في كود
الوكيل. الآن تراقب كلا المستويين دفعةً واحدة:
- Firewall → Events — كل حكم استدعاء أداة (
audit، استدعاءات shell المدمّر المرفوضة). انظر سجل الأحداث. - Guardrails → Matches — كل إصابة سياسة محتوى (علامات PII Shield).
balanced يكتب سياسة جدار حماية حقيقية قابلة للتحرير وحاجز حماية
حقيقياً (كل منهما مسمّى للمستوى)، يمكنك فتح أي منهما بعدها وضبطه — خط الأساس
نقطة بداية، وليس إعداداً مسبقاً مقفلاً.
4. التراجع استدعاء واحد
كل تغيير استقلالية قابل للعكس من لقطة تدقيقه، يستعيد الحالة السابقة بالضبط — السياسات، القواعد، حواجز الحماية، والإعدادات — وليس إعادة ضبط عامة.5. المسار الموصى به
ابدأ عريضاً، راقب، ثم شدّد من موقع رؤية:طبّق balanced
أثر تدقيق كامل؛ فقط shell المدمّر مرفوض؛ PII مُعلَّم. شغّل وكلاءك طبيعياً
ليوم أو يومين.
حاكِ tight
GET /api/workspace/firewall/simulate?level=tight وقارن رفضاته بما
أظهرته تغذية الأحداث فعلاً. إذا كانت الاستدعاءات بهيئة الجلب أو shell
المدمّر جزءاً من تدفّقك الطبيعي، أصلح الوكيل أولاً.اضبط بقواعد
خط الأساس أرضيتك. انحت استثناءات أو أضف عناصر تحكم لا يغطّيها بـ
قواعد جدار الحماية و
حواجز حماية مسمّاة. اربط سياسة أو حاجز حماية
محدداً بمفتاح فردي لنطاق أدق.
6. الأدوار لخط الأساس المدموج
تحكّم الاستقلالية يمتد عبر كلا المستويين، لكن كل إجراء محكوم بالدور.| الإجراء | الدور الأدنى |
|---|---|
| محاكاة مستوى / عرض Matches حواجز الحماية / عرض الأدوات المكتشفة | Member |
| عرض Events وRuns جدار الحماية | Developer+ |
| تطبيق مستوى استقلالية | Developer+ |
| التراجع عن تغيير استقلالية | Developer+ |
/api/workspace/firewall/* و
/api/guardrail/*). فقط استدعاءات ترحيل /v1/* تستخدم مفتاح sk-orca-…؛
مسارات مفتاح البوابة نطاق منفصل. انظر
النطاق: المفاتيح، السياسات، مساحات العمل.
7. بعد خط الأساس: أين تضبط كل مستوى
خط الأساس يحميك في أول 30 دقيقة. من هناك، لكل مستوى مرجعه الخاص للعمل الدقيق:نظرة عامة على جدار الحماية
الأحكام، الأسطح، عبارات الوسائط، الموافقات — مستوى الإجراء.
حواجز الحماية
قواعد الكلمة المفتاحية، regex، PII، llm_judge، والتأريض — مستوى المحتوى.
وضع الظل
اطرح سياسة جدار حماية مشدَّدة بالتدقيق فقط قبل الفرض.
خط أساس الوكلاء الآمنين
صفحة المفهوم لتحكّم الاستقلالية ودلالات تراجعه.
