لماذا يحتاج وكلاء الذكاء الاصطناعي إلى انعدام الثقة

الوكيل ليس طلباً ألّفته بالكامل. إنه يقرأ صفحات الويب، ويعالج المستندات، وينفّذ استدعاءات الأدوات بناءً على ما تخبره به تلك المصادر. أي من تلك المصادر يمكن أن يحمل تعليمات — ووكيلك، الذي يتصرف بحسن نية بناءً على محتوى محقون، يصبح وكيل المهاجم. ثق في الإجراء بناءً على مزاياه. ليس مصدره. هذه هي مقدمة انعدام الثقة لوكلاء الذكاء الاصطناعي. تشرح هذه الصفحة نموذج التهديد وترسم كل مبدأ على الضبط في OrcaRouter الذي يطبّقه. للبدء السريع أو الضبط العملي، انظر الروابط في الأسفل.

1. لماذا “أثق بوكيلي الخاص” هو النموذج الخاطئ

يثق أمان المحيط التقليدي بناءً على من أصدر الطلب. بمجرد مصادقة كيان، تكتسب إجراءاته تلك الثقة. لوكلاء الذكاء الاصطناعي، هذا ينهار فوراً:

وكيلك يقرأ صفحة منتج للإجابة على سؤال مستخدم. تحتوي الصفحة على . يرى الوكيل هذا كتعليمة — وليس كمحتوى غير موثوق.
وكيلك يعالج مستنداً مسترجعاً ويستدعي db.query بوسائط أملتها الوثيقة.
وكيلك يجلب URL أعادته نتيجة أداة. يُحلّ URL إلى خدمة داخلية.

في كل حالة، الإجراء صدر عن وكيلك — مصادق عليه، شرعي، مُخوَّل. وفي كل حالة، الإجراء لم يكن ما قصدته. هذه هي مشكلة النائب المرتبك: الوكيل يمتلك صلاحية محيطية لم يكسبها لهذه المهمة، ومهاجم يستغل تلك الصلاحية بالتحكم في ما يقرأه الوكيل. الثقة القائمة على الهوية تنهار لأن الوكيل هو المتصل الموثوق به. انعدام الثقة يعني التحقق من الإجراء، وليس الوكيل.

2. لماذا السلامة على مستوى المطالبة وحدها غير كافية

مرشح المحتوى الذي يقرأ المطالبات والاستجابات لا يرى:

استدعاءات الأدوات — ما اسم الوظيفة، ما الوسائط، ما الآثار الجانبية.
الخروج — أي وجهة شبكية يحتوي عليها تقرير الأداة.
القدرات المثبتة ذاتياً — خوادم MCP ومهارات حمّلها الوكيل في وقت التشغيل ولم تراجعها أنت قط.
التكلفة — حلقة متهالكة تستدعي أداة مكلفة 800 مرة في 90 ثانية.

صُمّمت سلامة المطالبة للمحادثات: نص يدخل، نص يخرج، إنسان يقرأه. الوكلاء يكسرون كل هذه الافتراضات. تأمينهم يتطلب مستوى تحكم يرى الإجراءات، وليس الكلمات فحسب — مستوى يجلس على مسار كل استدعاء أداة، بصرف النظر عن أي نموذج أصدره أو كيف وصلت القدرة إلى هناك.

3. المبادئ الأربعة لانعدام الثقة، مرسومة على OrcaRouter

تحقّق من كل طلب — وليس المتصل

يرفض انعدام الثقة فكرة المحيط الآمن. كل استدعاء يُفحص بناءً على محتواه، بصرف النظر عن أي مفتاح أو وكيل أصدره. يضع OrcaRouter نقطة اختناق التطبيق عند البوابة — المسار الوحيد الذي يجب أن يعبره كل استدعاء للوصول إلى نموذج أو أداة:

كل طلب واستجابة واستدعاء أداة يعبر البوابة — بالإضافة إلى كل وجهة خارجية يوجّهها وكيلك من خلالها — يُقيَّم مقابل السياسات النشطة لمساحة العمل.
لا يوجد إعفاء “وكيل موثوق”. استدعاء صادر عن وكيلك في الإنتاج واستدعاء صادر عن تعليمة محقونة يبدوان متطابقين للمتصل — البوابة تفحصهما معاً.
تُخزَّن بيانات الاعتماد مشفّرة. التقارير موقّعة بـ Ed25519 وقابلة للتحقق العلني.

أقل صلاحية

يجب أن يمتلك الوكيل القدرة التي يحتاجها لمهمته تحديداً — لا أكثر. يطبّق OrcaRouter هذا على مستويين: مفاتيح API محددة النطاق — كل مفتاح يرتبط بمجموعة محددة من النماذج، وقائمة سماح IP، وسقف إنفاق، وصلاحية انتهاء، وسياسة حواجز الحماية وجدار الحماية المحددة التي تنطبق. مفتاح الوكيل لا يستطيع تجاوز نطاقه حتى لو حاولت التعليمات المحقونة توجيهه في مكان آخر. انظر المفاتيح المحددة النطاق والسياسات ومساحات العمل. قوائم سماح الأدوات — يمكن لقواعد جدار الحماية تقييد الأدوات التي يُسمح لوكيل المفتاح باستدعائها. يمكن ربط مفتاح صادر لوكيل بحث للقراءة فقط بسياسة ترفض أي أداة من جانب الكتابة — db.insert، fs.write، shell.exec — على البوابة، قبل تشغيل الأداة. نموذج الوكيل لا يرى الاستدعاء ينجح قط.

تُنشأ المفاتيح المحددة النطاق وسياسات جدار الحماية وتُغيَّر بواسطة أدوار Developer+. قراءة السياسات مفتوحة لأي عضو في مساحة العمل.

الحجب الافتراضي على ما يهم، والسماح الصريح على ما تقصده

السماح المفتوح يصبح متقادماً. مستوى الاستقلالية tight يضبط مساحة عملك بالكامل على موقف الحجب الافتراضي — أوامر shell المدمّرة وخروج SSRF محجوبة بشكل افتراضي، وحاجز الأسرار يفحص الأسرار في طلباتك. تفتح صراحةً الإجراءات التي تحتاجها، بدلاً من حجب صريح لتلك التي لا تريدها. يمكن أن يكون default_verdict لجدار الحماية لسياسة ما allow أو audit أو deny. السياسات المُنشأة حديثاً تكون افتراضياً audit — راقب كل شيء، لا تحجب شيئاً — حتى تتمكن من رؤية ما يفعله وكلاؤك فعلاً قبل أن تشدّد. مستوى الاستقلالية tight يضبط هذا إلى deny على الأسطح المهمة.

مستوى الاستقلالية	الموقف
`tight`	حجب افتراضي؛ shell المدمّر وخروج SSRF مرفوضان؛ حواجز PII Shield والأسرار مفعّلة.
`balanced`	تدقيق افتراضياً، رفض shell المدمّر، تعليم PII. الموقف الابتدائي الموصى به.
`permissive`	لا تطبيق؛ وضع observe مفعّل حتى يُسجَّل كل إجراء كثغرة.

طبّق مستوى استقلالية بـ POST /api/workspace/firewall/autonomy (Developer+). يضبط Firewall وGuardrails بشكل ذري، مع التراجع بنقرة واحدة.

افترض الاختراق — وكن مستعداً لإثباته

يفترض انعدام الثقة أن بعض الاستدعاءات ستمر، وأن بعض التعليمات ستُحقن، وأن بعض الوكلاء سيتصرف بشكل خاطئ. مجموعة التحكم مصممة وفق ذلك: مسار التدقيق — كل تطابق وحكم وموافقة يُسجَّل في تغذية الأحداث والمطابقات لمساحة العمل ويُرتبط بتشغيل الوكيل الذي تسبب فيه. يمكنك إعادة بناء ما فعله وكيلك بالضبط، وبأي ترتيب، ولماذا سُمح لكل استدعاء أو حُجب. كشف الشذوذ — يتعلّم جدار الحماية شكل استخدام الأدوات الطبيعي لكل مساحة عمل ويعلّم الانحرافات: ارتفاعات المعدل والتكلفة مقابل خط أساس متحرك على 14 يوماً، وحلقات إعادة المحاولة، وانتقالات أداة-إلى-أداة لم تقم بها مساحة العمل من قبل. انظر جدار الحماية. الموافقات البشرية — يُعلَّق حكم pending_approval استدعاءً لمراجع خارج النطاق قبل وصوله للأداة. استخدمه على أي إجراء عالي المخاطر أو لا رجعة فيه أو جديد. الوكيل ينتظر؛ المراجع يوافق أو يرفض؛ القرار يُسجَّل. لا تغيير في الكود مطلوب. يتطلب كشف الشذوذ والموافقات Developer+ للتصرف؛ تغذية الشذوذ قابلة للقراءة لأي عضو، بينما تغذيتا Events وRuns تتطلبان Developer+.

4. مجموعة التحكم بالترتيب

يطبّق OrcaRouter هذه الطبقات الأربع على كل استدعاء، بالتسلسل:

الطبقة	ما تطبّقه	كيف ترسم على مبدأ انعدام الثقة
المفاتيح المحددة النطاق	الهوية وحدود القدرة	أقل صلاحية
حواجز الحماية	المحتوى في المطالبات والاستجابات	تحقّق من كل طلب (طبقة النص)
جدار الحماية للوكيل	استدعاءات الأدوات والخروج والتكلفة	تحقّق من كل طلب (طبقة الإجراء)؛ حجب افتراضي
التدقيق والشذوذ	الإسناد وكشف الانحراف	افترض الاختراق

لا طبقة تعرف أو تثق في ما قررته الطبقة التي قبلها. تفحص حواجز الحماية النص؛ يحكم جدار الحماية الإجراءات — إنهما مستويان متكاملان، وليسا متكررين. انظر حواجز الحماية مقابل جدار الحماية لمعرفة أي تهديد تصطاد كل طبقة بالضبط.

5. ماذا يعني هذا لتكاملك

لا يجب عليك تغيير كود وكيلك للحصول على تطبيق انعدام الثقة. يستمر وكيلك في استدعاء https://api.orcarouter.ai/v1 تماماً كما كان. السياسة تعيش في البوابة — اضبطها مرة واحدة في مساحة عملك، وارتبط بمفتاح، وكل استدعاء يصدره ذلك المفتاح يُحكم فيه من الطلب التالي. الموقف الافتراضي (audit + observe mode) غير مُدمِّر: يسجّل كل شيء ولا يحجب شيئاً، حتى تستطيع مراقبة استخدام الأداة الحقيقي لوكيلك قبل كتابة القواعد. ابدأ من هناك.

ضبط البوابة يخضع لتبويب الأدوار. قراءة السياسات والإعدادات مفتوحة لأي عضو في مساحة العمل؛ تغذيتا Events وRuns لجدار الحماية تتطلبان Developer+. إنشاء أو تغيير حواجز الحماية وسياسات جدار الحماية والمفاتيح ومستويات الاستقلالية يتطلب Developer+. تقارير الامتثال وقراءة النص الصريح لمفتاح البوابة تتطلبان Admin.

مجموعة التحكم

كيف تتركّب الطبقات الأربع على كل طلب — مسار التطبيق الكامل من المفتاح إلى التدقيق.

خط الأساس للوكلاء الآمنين

الموقف الابتدائي الموصى به — مستوى استقلالية واحد، مراقبة حركة المرور الحقيقية، ثم التشديد.

البدء السريع

فعّل انعدام الثقة في 5 دقائق.

​1. لماذا “أثق بوكيلي الخاص” هو النموذج الخاطئ

​2. لماذا السلامة على مستوى المطالبة وحدها غير كافية

​3. المبادئ الأربعة لانعدام الثقة، مرسومة على OrcaRouter

​تحقّق من كل طلب — وليس المتصل

​أقل صلاحية

​الحجب الافتراضي على ما يهم، والسماح الصريح على ما تقصده

​افترض الاختراق — وكن مستعداً لإثباته

​4. مجموعة التحكم بالترتيب

​5. ماذا يعني هذا لتكاملك

مجموعة التحكم

خط الأساس للوكلاء الآمنين

البدء السريع

1. لماذا “أثق بوكيلي الخاص” هو النموذج الخاطئ

2. لماذا السلامة على مستوى المطالبة وحدها غير كافية

3. المبادئ الأربعة لانعدام الثقة، مرسومة على OrcaRouter

تحقّق من كل طلب — وليس المتصل

أقل صلاحية

الحجب الافتراضي على ما يهم، والسماح الصريح على ما تقصده

افترض الاختراق — وكن مستعداً لإثباته

4. مجموعة التحكم بالترتيب

5. ماذا يعني هذا لتكاملك