الانتقال إلى المحتوى الرئيسي
قرأت صفحة تحكّم وبقي لديك سؤال واحد قبل أن تطلق. هذه هي الأسئلة الشائعة حول أمان وكيل الذكاء الاصطناعي — الأسئلة الشاملة التي تمتد عبر قسم انعدام الثقة بأكمله، مُجابة في مكان واحد، كل منها يربط إلى المرجع للتعمّق. إذا كنت جديداً تماماً على هذا القسم، ابدأ من تأمين وكلاء الذكاء الاصطناعي و مجموعة التحكم؛ تفترض هذه الصفحة أنك تعرف أن هناك مستويي فرض — حواجز الحماية (نص المطالبة/الاستجابة) وجدار الحماية (إجراءات الوكيل) — وتحتاج فقط إلى تثبيت الحواف.

1. الأسئلة الشائعة حول أمان وكيل الذكاء الاصطناعي — ابدأ من هنا

خريطة من 30 ثانية لأي تحكّم يجيب أي سؤال:
أنت تسأل عن…المستوىاقرأ
النص في المطالبات أو الاستجابات (PII، الأسرار، jailbreaks)حواجز الحمايةحواجز الحماية
استدعاءات الأدوات، MCP، egress، المهاراتجدار الحمايةجدار الحماية
أيّهما أُطلق على 400أيّهمالماذا حُجب؟
كل حجب أمني على البوابة المستضافة هو HTTP 400 مع code قابل للقراءة آلياً. اقرأ الرمز أولاً — إنه يفرّعك إلى التغذية الصحيحة. يعيش الجدول الكامل في رموز الأخطاء.

2. حواجز الحماية — فحص المحتوى

لا شيء. الحل هو: guardrail_id صريح على المفتاح (إن كان موجوداً ومفعّلاً) ← وإلا حاجز حماية is_default لمساحة العمل ← وإلا لا فرض. الربط الصريح المعطّل هو مفتاح الإطفاء — وهو لا يتراجع إلى الافتراضي. مع عدم حل أي شيء، يكون الطلب متطابقاً بايت ببايت مع مساحة عمل لم تفعّل الميزة أبداً.
لا. إجراء block يعيد 400 guardrail_blocked ولا يكلّف حصة — حجب مرحلة الإدخال يُطلق قبل القياس؛ وحجب مرحلة الإخراج يردّ الحصة المستهلكة مسبقاً. وهو أيضاً مُعلَّم skip-retry: إعادة تشغيل نفس المطالبة يحجب مجدداً فحسب.
أنواع القواعد: keyword، regex، pii، max_chars، external، llm_judge، grounding. الإجراءات: block (رفض)، mask (تنقيح وتمرير)، flag (تسجيل فقط، بلا تغيير في حركة المرور). المراحل: input، output، both. انظر حواجز الحماية لكل منها.
تشمل الكيانات المدمجة email، phone، credit_card، ssn، ip، iban، mac_address، jwt، aws_access_key، api_key_openai، bitcoin_address، إضافة إلى الأنواع الإقليمية (jp_mynumber، kr_rrn، cn_resident_id). إجراء mask يعرض وسماً مُصنّفاً — jane@acme.com[EMAIL]، ورقم SSN ← [SSN]. يمكنك طبقة حتى 25 كيان regex مخصص لكل قاعدة (مع جمع تحقّق Luhn اختياري) وتجاوز الإجراء لكل كيان عبر entity_actions.
حجب الإخراج مفروض في الاتجاهين — تُفحص الاستجابات غير المتدفقة قبل أن تعود، ويقطع ماسح متدفق التدفق في منتصفه. إخفاء الإخراج حالياً غير متدفق فقط؛ على استجابة متدفقة تمرّ الكتلة دون إخفاء (إعادة كتابة التدفق ضمن النطاق على خارطة الطريق). إخفاء مرحلة الإدخال — تطهير الطلب قبل أن يراه النموذج — نشِط بغض النظر. الإعداد المسبق PII Shield يُخفي في مرحلة الإدخال اليوم.
قواعد keyword / regex / pii / max_chars لا تجري أي استدعاء نموذج ولا تفوتر شيئاً. قاعدة llm_judge تجري فحصاً دلالياً عبر نموذج مساحة العمل (محدوداً بـ judge_timeout_ms، fail-open افتراضياً) وتُفوتر كـبند فرعي للحَكَم منفصل. قاعدة grounding تسجّل أمانة الإجابة مقابل المصادر المسترجعة للطلب (العتبة الافتراضية 0.7) بنفس الطريقة.
افتح تغذية Matches (GET /api/guardrail/match، Member). يسجّل كل صف نوع القاعدة، والإجراء، والمرحلة، وسلسلة تفصيل — والسلسلة الفرعية المطابقة فقط إذا كان “Log raw content” مفعّلاً لذلك الحاجز (مطفأ افتراضياً، الموقف المحافظ على الخصوصية). حجب خاطئ؟ علّمه كإيجابية كاذبة (POST /api/guardrail/match/:id/mark-fp، Admin).
يمكن لحاجز حماية أن يزيّن مطالبة بـاستشارة أمن كود (مثل ملاحظة CVE/SBOM على حزمة مُشار إليها) دون حجب النص أو إخفائه. هذه طبقة شرح تعزّز الطلب بدلاً من رفضه — متمايزة عن إجراءات block / mask / flag التي تؤلّفها مباشرة. اربط ماسحاً تحت Integrations لتشغيلها.

3. جدار الحماية — إجراءات الوكيل

فرق رئيسي واحد: سياسة جدار حماية مرتبطة معطّلة تتراجع إلى افتراضي مساحة العمل، بينما حاجز حماية مرتبط معطّل يُحَل إلى لا شيء. عدا ذلك يرتبط كلاهما عبر المفتاح (firewall_policy_id / guardrail_id) ويتشاركان تراجع افتراضي مساحة العمل. انظر حواجز الحماية مقابل جدار الحماية.
الأحكام: allow، audit، deny، sanitize، pending_approval، cap_cost. الـ default_verdict هو allow / audit / deny (audit افتراضياً). الأسطح: inbound (الأدوات المُعلَن عنها)، response (استدعاءات tool_calls المُصدَرة من النموذج)، mcp (استدعاء tools/callegress (host/IP/CIDR صادر). يفكّ مسرد الأحكام كلاً منها.
لا — وهذا هو الالتباس الشائع. حكم sanitize ينقّح السلاسل الفرعية المطابقة من وسائط استدعاء الأداة فقط، وليس أبداً المحتوى الذي تعيده أداة. على سطح inbound (لا وسائط وقت استدعاء بعد) يتصاعد sanitize إلى deny.
مفتاح واحد يضبط موقفك بأكمله، كاتباً صفوف autonomy_* حقيقية قابلة للتحرير:
balanced (البداية الموصى بها) — audit افتراضي، deny لـ shell المدمّر، PII Shield في وضع التدقيق فقط (يعلّم PII).
tight — حجب افتراضي، deny لـ shell المدمّر، deny لأدوات الجلب على شكل SSRF، حواجز PII Shield + Secrets Blocker مفروضة.
permissive — مراقبة فقط.
تراجع بنقرة واحدة يستعيد الحالة السابقة من لقطة التدقيق التي كتبها التطبيق. إنها خطوة واحدة — التراجع غير متاح بمجرد أن يتجاوز تطبيق لاحق (أو تحرير سياسة يدوي) تلك اللقطة. انظر أوضاع الفرض.
ليس بالإعداد المسبق. إعداد SSRF المسبق لاستقلالية tight يرفض أسماء الأدوات الشائعة على شكل الجلب (http_fetch، web_search، fetch_url، request). للرفض حسب الوجهة — نطاقات RFC-1918، عناوين IP لبيانات السحابة الوصفية، CIDRs محددة — ألّف قاعدة رفض host/CIDR خاصة بك على سطح egress. لا يأتي أي إعداد مسبق بقواعد CIDR لك. انظر Egress وتسريب البيانات.
فعّل وضع الظل (لكل سياسة): تقيّم السياسة وتسجّل لكنها تخفّض كل حكم فارض إلى audit، مُسبِقةً السبب بـ [shadow] would …. راقب عرضي Events وRuns، ثم أطفئ الظل لتبدأ الفرض. وضع observe على مستوى مساحة العمل (firewall_observe_mode) هو قرص الاكتشاف المكمّل — يسجّل الاستدعاءات غير المغطّاة كثغرات في Discovered Tools.
حكم pending_approval يعيد 400 firewall_approval_pending مع معرّف موافقة. يحلّها مراجِع من وحدة التحكم (Developer+) أو عبر استدعاء webhook مُوقَّع بـ HMAC (POST /api/v1/firewall/approvals/:id/callback). يستطلع الوكيل GET /api/v1/firewall/approvals/:id ويعيد تقديم الاستدعاء الأصلي بترويسة X-OrcaRouter-Firewall-Approval أحادية الاستخدام. انظر استدعاءات الأدوات الخطرة.
ارتفاعات المعدل/التكلفة مسجّلة مقابل خط أساس مُتعلَّم لساعة الأسبوع (14 يوماً)، إضافة إلى retry_loop وnovel_path (انتقال من أداة إلى أداة لم يُرَ من قبل). التغذية قابلة للقراءة من قبل Member؛ يمكنك تأجيل شذوذ لمدة تصل إلى 7 أيام. انظر الاستقلالية المفرطة.

4. MCP والمفاتيح ووصول البوابة

سجّل خادماً (name، endpoint، auth_mode بقيمة none/bearer/oauth/basic، بيانات اعتماد مشفّرة) وتقيّم بوابة MCP كل tools/call على سطح mcp قبل الإرسال. تُتتبّع الصحة (ok/degraded/down)؛ افحصها بـ POST /api/workspace/firewall/mcp_servers/:id/probe. يضع الفحص أيضاً خط أساس لمخطط الأدوات المُعلَن عنه للخادم — يقلب الانحراف اللاحق حالة مخططه من verified إلى changed (إشارة “السحب من تحت الأقدام”)، وتقوم إما بإعادة خط الأساس (موافقة) أو quarantine للخادم. فالحوكمة هي تقييم لكل استدعاء إضافة إلى تتبّع سلامة المخطط ونطاقات مخاطر المهارات. انظر Firewall MCP و تسميم أدوات MCP.
كل مهارة تُفحص إلى نطاق مخاطر بوضع فرض allow / quarantine / block. المهارة المحجوزة في الحجر الصحي تُحتجز للموافقة؛ تبقى المهارات المكتشفة آلياً في الحجر حتى يراجعها إنسان. يركب الوضع فوق حكم القاعدة.
model_limits (+ model_limits_enabledallow_ips، credit_limit_usd (0 = غير محدود)، expired_time (-1 = أبداً)، environment، guardrail_id، firewall_policy_id، و is_firewall_gateway. ادمجها من أجل أقل استقلالية — انظر النطاق والمفاتيح والسياسات. تُخفى المفاتيح عند العرض.
تتطلب مسارات البوابة تلك (POST /evaluate، POST /evaluate_plan، ANY /mcp) مفتاحاً بـ is_firewall_gateway=true — رمز مخصّص ضمن نطاق بوابة جدار الحماية، وليس مفتاح الترحيل sk-orca-… الخاص بك. سكّ واحد وقراءة نصه الصريح يتطلبان Admin+.
يجري الضبط في وحدة التحكم — تُدار حواجز الحماية وسياسات جدار الحماية وخوادم MCP والامتثال تحت رمز الجلسة/الوصول الخاص بك (UserAuth)، وكل كتابة محكومة بالدور (Developer+ لكتابات السياسة والحاجز). فقط حركة الترحيل /v1/* الخاصة بك تستخدم مفتاح sk-orca-…؛ وفقط خطّافات البوابة /api/v1/firewall/* تستخدم الرمز ضمن نطاق بوابة جدار الحماية.

5. الامتثال والإقامة والبيانات

يشمل الكتالوج SOC 2، HIPAA، GDPR، UK GDPR، قانون الذكاء الاصطناعي الأوروبي EU AI Act، ISO 27001، ISO 42001، NIST AI RMF، PCI DSS، CCPA، GLBA، قائمة OWASP العشر لتطبيقات LLM (كتخطيط تحكّم)، إضافة إلى ملفات إقليمية (PIPL، APPI، PIPA، LGPD، PIPEDA، DPDP، APPs الأسترالية، PDPA السنغافوري، DORA، وعدة قوانين ولايات أمريكية). تصفّح الكتالوج، والحزم، والجاهزية — كلها Member، مجاناً — عند /api/compliance/*.
التصفّح مجاني؛ تثبيت حزمة، وتوليد تقرير، والانتقال إلى الإنتاج، وضبط الإقامة تتطلب Admin لمساحة العمل وخطة مدفوعة (محكوم من الخادم). تثبيت حزمة (POST /api/compliance/packs/:key/install) يجسّد حواجز حماية + سياسات جدار حماية حقيقية يمكنك تحريرها بعد ذلك.
نعم. التقرير موقّع بـ Ed25519 + SHA-256 وقابل للتحقّق علناً: اجلب المفتاح العام (GET /api/public/compliance/pubkey)، تحقّق من تقرير (POST /api/public/compliance/verify)، أو سلّم مدقّقاً رابط مشاركة (GET /api/public/compliance/share/:token). التصديرات CSV / JSON / PDF.
إنها منطقة أثر تقرير الامتثال (us، eu، uk، ap، cn، global)، قابلة للضبط عبر PUT /api/compliance/residency (Admin)؛ تُحجب القراءة عبر المناطق. إنها ليست تثبيتاً جغرافياً لبيانات استدلالك. انظر المسؤولية المشتركة.
يبلغ الاحتفاظ بسجل الطلبات افتراضياً 30 يوماً ويُقصّ من الخادم إلى حدّ أقصى صارم قدره 180 يوماً. يُحتجز حذف الحساب لنافذة سماح (افتراضياً 30 يوماً) قبل تشغيل تطهير PII غير قابل للرجوع؛ يطهّر ذلك التطهير تتالياً حمولات سجل طلبات Mongo، ومطابقات حواجز الحماية، وأحداث جدار الحماية المنسوبة إليك. أرشفة مساحة عمل تطهّر تتالياً نفس المجموعات الثلاث لتلك المساحة. انظر تعرّض PII.
رمز 400 من تحكّم أمني ليس خطأً في مطالبتك. إنها سياسة تؤدي عملها. لا تُعِد المحاولة — هذه الرموز skip-retry. تتبّع القاعدة، ثم قرّر ما إذا كنت ستصلح الاستدعاء أو ترخي السياسة: لماذا حُجب؟.

6. ما زلت عالقاً؟

رموز الأخطاء

كل حجب وتعليق ورفض يمكن أن تعيده البوابة.

لماذا حُجب؟

اقرأ الرمز، افتح التغذية الصحيحة، اعثر على القاعدة بالضبط.

واجهة برمجة حواجز الحماية

المسارات والأدوار والحمولات لسياسات المحتوى.

واجهة برمجة جدار الحماية

مسارات وحدة التحكم والبوابة لحوكمة الإجراءات.

واجهة برمجة الامتثال

نقاط نهاية الكتالوج، والتثبيت، والتقرير، والإقامة.

المسرد

كل مصطلح مستخدم عبر وثائق انعدام الثقة.
للتهديدات التي توقفها هذه التحكّمات، ابدأ من نموذج التهديد. لخط أساس نظيف، اتبع خط أساس الوكلاء الآمنين.