الأسئلة الشائعة حول الأمان

قرأت صفحة تحكّم وبقي لديك سؤال واحد قبل أن تطلق. هذه هي الأسئلة الشائعة حول أمان وكيل الذكاء الاصطناعي — الأسئلة الشاملة التي تمتد عبر قسم انعدام الثقة بأكمله، مُجابة في مكان واحد، كل منها يربط إلى المرجع للتعمّق. إذا كنت جديداً تماماً على هذا القسم، ابدأ من تأمين وكلاء الذكاء الاصطناعي و مجموعة التحكم؛ تفترض هذه الصفحة أنك تعرف أن هناك مستويي فرض — حواجز الحماية (نص المطالبة/الاستجابة) وجدار الحماية (إجراءات الوكيل) — وتحتاج فقط إلى تثبيت الحواف.

1. الأسئلة الشائعة حول أمان وكيل الذكاء الاصطناعي — ابدأ من هنا

خريطة من 30 ثانية لأي تحكّم يجيب أي سؤال:

أنت تسأل عن…	المستوى	اقرأ
النص في المطالبات أو الاستجابات (PII، الأسرار، jailbreaks)	حواجز الحماية	حواجز الحماية
استدعاءات الأدوات، MCP، egress، المهارات	جدار الحماية	جدار الحماية
أيّهما أُطلق على `400`	أيّهما	لماذا حُجب؟

كل حجب أمني على البوابة المستضافة هو HTTP 400 مع code قابل للقراءة آلياً. اقرأ الرمز أولاً — إنه يفرّعك إلى التغذية الصحيحة. يعيش الجدول الكامل في رموز الأخطاء.

2. حواجز الحماية — فحص المحتوى

ماذا يحدث إذا لم يُحَل أي حاجز حماية على طلب؟

لا شيء. الحل هو: guardrail_id صريح على المفتاح (إن كان موجوداً ومفعّلاً) ← وإلا حاجز حماية is_default لمساحة العمل ← وإلا لا فرض. الربط الصريح المعطّل هو مفتاح الإطفاء — وهو لا يتراجع إلى الافتراضي. مع عدم حل أي شيء، يكون الطلب متطابقاً بايت ببايت مع مساحة عمل لم تفعّل الميزة أبداً.

هل يكلّفني الطلب المحجوب حصة؟

لا. إجراء block يعيد 400 guardrail_blocked ولا يكلّف حصة — حجب مرحلة الإدخال يُطلق قبل القياس؛ وحجب مرحلة الإخراج يردّ الحصة المستهلكة مسبقاً. وهو أيضاً مُعلَّم skip-retry: إعادة تشغيل نفس المطالبة يحجب مجدداً فحسب.

ما أنواع القواعد والإجراءات الموجودة؟

أنواع القواعد: keyword، regex، pii، max_chars، external، llm_judge، grounding. الإجراءات: block (رفض)، mask (تنقيح وتمرير)، flag (تسجيل فقط، بلا تغيير في حركة المرور). المراحل: input، output، both. انظر حواجز الحماية لكل منها.

أي كيانات PII تُكتشف، وكيف يبدو القناع؟

تشمل الكيانات المدمجة email، phone، credit_card، ssn، ip، iban، mac_address، jwt، aws_access_key، api_key_openai، bitcoin_address، إضافة إلى الأنواع الإقليمية (jp_mynumber، kr_rrn، cn_resident_id). إجراء mask يعرض وسماً مُصنّفاً — jane@acme.com ← [EMAIL]، ورقم SSN ← [SSN]. يمكنك طبقة حتى 25 كيان regex مخصص لكل قاعدة (مع جمع تحقّق Luhn اختياري) وتجاوز الإجراء لكل كيان عبر entity_actions.

هل يُفرض إخفاء الإخراج على الاستجابات المتدفقة؟

حجب الإخراج مفروض في الاتجاهين — تُفحص الاستجابات غير المتدفقة قبل أن تعود، ويقطع ماسح متدفق التدفق في منتصفه. إخفاء الإخراج حالياً غير متدفق فقط؛ على استجابة متدفقة تمرّ الكتلة دون إخفاء (إعادة كتابة التدفق ضمن النطاق على خارطة الطريق). إخفاء مرحلة الإدخال — تطهير الطلب قبل أن يراه النموذج — نشِط بغض النظر. الإعداد المسبق PII Shield يُخفي في مرحلة الإدخال اليوم.

ماذا يكلّف حَكَم LLM؟

قواعد keyword / regex / pii / max_chars لا تجري أي استدعاء نموذج ولا تفوتر شيئاً. قاعدة llm_judge تجري فحصاً دلالياً عبر نموذج مساحة العمل (محدوداً بـ judge_timeout_ms، fail-open افتراضياً) وتُفوتر كـبند فرعي للحَكَم منفصل. قاعدة grounding تسجّل أمانة الإجابة مقابل المصادر المسترجعة للطلب (العتبة الافتراضية 0.7) بنفس الطريقة.

هل يمكنني رؤية ما طابقته القاعدة فعلاً؟

افتح تغذية Matches (GET /api/guardrail/match، Member). يسجّل كل صف نوع القاعدة، والإجراء، والمرحلة، وسلسلة تفصيل — والسلسلة الفرعية المطابقة فقط إذا كان “Log raw content” مفعّلاً لذلك الحاجز (مطفأ افتراضياً، الموقف المحافظ على الخصوصية). حجب خاطئ؟ علّمه كإيجابية كاذبة (POST /api/guardrail/match/:id/mark-fp، Admin).

هل تفحصون التبعيات بحثاً عن CVEs معروفة؟

يمكن لحاجز حماية أن يزيّن مطالبة بـاستشارة أمن كود (مثل ملاحظة CVE/SBOM على حزمة مُشار إليها) دون حجب النص أو إخفائه. هذه طبقة شرح تعزّز الطلب بدلاً من رفضه — متمايزة عن إجراءات block / mask / flag التي تؤلّفها مباشرة. اربط ماسحاً تحت Integrations لتشغيلها.

3. جدار الحماية — إجراءات الوكيل

كيف يختلف جدار الحماية عن حواجز الحماية في الحل؟

فرق رئيسي واحد: سياسة جدار حماية مرتبطة معطّلة تتراجع إلى افتراضي مساحة العمل، بينما حاجز حماية مرتبط معطّل يُحَل إلى لا شيء. عدا ذلك يرتبط كلاهما عبر المفتاح (firewall_policy_id / guardrail_id) ويتشاركان تراجع افتراضي مساحة العمل. انظر حواجز الحماية مقابل جدار الحماية.

ما الأحكام والأسطح؟

الأحكام: allow، audit، deny، sanitize، pending_approval، cap_cost. الـ default_verdict هو allow / audit / deny (audit افتراضياً). الأسطح: inbound (الأدوات المُعلَن عنها)، response (استدعاءات tool_calls المُصدَرة من النموذج)، mcp (استدعاء tools/call)، egress (host/IP/CIDR صادر). يفكّ مسرد الأحكام كلاً منها.

هل ينظّف `sanitize` ما تعيده أداة؟

لا — وهذا هو الالتباس الشائع. حكم sanitize ينقّح السلاسل الفرعية المطابقة من وسائط استدعاء الأداة فقط، وليس أبداً المحتوى الذي تعيده أداة. على سطح inbound (لا وسائط وقت استدعاء بعد) يتصاعد sanitize إلى deny.

ماذا تفعل مستويات الاستقلالية؟

مفتاح واحد يضبط موقفك بأكمله، كاتباً صفوف autonomy_* حقيقية قابلة للتحرير:
• balanced (البداية الموصى بها) — audit افتراضي، deny لـ shell المدمّر، PII Shield في وضع التدقيق فقط (يعلّم PII).
• tight — حجب افتراضي، deny لـ shell المدمّر، deny لأدوات الجلب على شكل SSRF، حواجز PII Shield + Secrets Blocker مفروضة.
• permissive — مراقبة فقط.
تراجع بنقرة واحدة يستعيد الحالة السابقة من لقطة التدقيق التي كتبها التطبيق. إنها خطوة واحدة — التراجع غير متاح بمجرد أن يتجاوز تطبيق لاحق (أو تحرير سياسة يدوي) تلك اللقطة. انظر أوضاع الفرض.

هل يحجب إعداد SSRF المسبق عناوين IP الخاصة وبيانات السحابة الوصفية؟

ليس بالإعداد المسبق. إعداد SSRF المسبق لاستقلالية tight يرفض أسماء الأدوات الشائعة على شكل الجلب (http_fetch، web_search، fetch_url، request). للرفض حسب الوجهة — نطاقات RFC-1918، عناوين IP لبيانات السحابة الوصفية، CIDRs محددة — ألّف قاعدة رفض host/CIDR خاصة بك على سطح egress. لا يأتي أي إعداد مسبق بقواعد CIDR لك. انظر Egress وتسريب البيانات.

كيف أطرح سياسة دون كسر حركة المرور؟

فعّل وضع الظل (لكل سياسة): تقيّم السياسة وتسجّل لكنها تخفّض كل حكم فارض إلى audit، مُسبِقةً السبب بـ [shadow] would …. راقب عرضي Events وRuns، ثم أطفئ الظل لتبدأ الفرض. وضع observe على مستوى مساحة العمل (firewall_observe_mode) هو قرص الاكتشاف المكمّل — يسجّل الاستدعاءات غير المغطّاة كثغرات في Discovered Tools.

كيف تعمل الموافقة البشرية (HITL)؟

حكم pending_approval يعيد 400 firewall_approval_pending مع معرّف موافقة. يحلّها مراجِع من وحدة التحكم (Developer+) أو عبر استدعاء webhook مُوقَّع بـ HMAC (POST /api/v1/firewall/approvals/:id/callback). يستطلع الوكيل GET /api/v1/firewall/approvals/:id ويعيد تقديم الاستدعاء الأصلي بترويسة X-OrcaRouter-Firewall-Approval أحادية الاستخدام. انظر استدعاءات الأدوات الخطرة.

عمَّ يبحث كشف الشذوذ؟

ارتفاعات المعدل/التكلفة مسجّلة مقابل خط أساس مُتعلَّم لساعة الأسبوع (14 يوماً)، إضافة إلى retry_loop وnovel_path (انتقال من أداة إلى أداة لم يُرَ من قبل). التغذية قابلة للقراءة من قبل Member؛ يمكنك تأجيل شذوذ لمدة تصل إلى 7 أيام. انظر الاستقلالية المفرطة.

4. MCP والمفاتيح ووصول البوابة

كيف تُحكم خوادم MCP؟

سجّل خادماً (name، endpoint، auth_mode بقيمة none/bearer/oauth/basic، بيانات اعتماد مشفّرة) وتقيّم بوابة MCP كل tools/call على سطح mcp قبل الإرسال. تُتتبّع الصحة (ok/degraded/down)؛ افحصها بـ POST /api/workspace/firewall/mcp_servers/:id/probe. يضع الفحص أيضاً خط أساس لمخطط الأدوات المُعلَن عنه للخادم — يقلب الانحراف اللاحق حالة مخططه من verified إلى changed (إشارة “السحب من تحت الأقدام”)، وتقوم إما بإعادة خط الأساس (موافقة) أو quarantine للخادم. فالحوكمة هي تقييم لكل استدعاء إضافة إلى تتبّع سلامة المخطط ونطاقات مخاطر المهارات. انظر Firewall MCP و تسميم أدوات MCP.

ماذا يحدث لمهارة خطرة أو مكتشفة آلياً؟

كل مهارة تُفحص إلى نطاق مخاطر بوضع فرض allow / quarantine / block. المهارة المحجوزة في الحجر الصحي تُحتجز للموافقة؛ تبقى المهارات المكتشفة آلياً في الحجر حتى يراجعها إنسان. يركب الوضع فوق حكم القاعدة.

أي حقول مفتاح تُحكم قبضتها على الوكيل؟

model_limits (+ model_limits_enabled)، allow_ips، credit_limit_usd (0 = غير محدود)، expired_time (-1 = أبداً)، environment، guardrail_id، firewall_policy_id، و is_firewall_gateway. ادمجها من أجل أقل استقلالية — انظر النطاق والمفاتيح والسياسات. تُخفى المفاتيح عند العرض.

لماذا أحصل على 403 على `/api/v1/firewall/*`؟

تتطلب مسارات البوابة تلك (POST /evaluate، POST /evaluate_plan، ANY /mcp) مفتاحاً بـ is_firewall_gateway=true — رمز مخصّص ضمن نطاق بوابة جدار الحماية، وليس مفتاح الترحيل sk-orca-… الخاص بك. سكّ واحد وقراءة نصه الصريح يتطلبان Admin+.

ما الفرق بين الضبط والاستدعاء؟

يجري الضبط في وحدة التحكم — تُدار حواجز الحماية وسياسات جدار الحماية وخوادم MCP والامتثال تحت رمز الجلسة/الوصول الخاص بك (UserAuth)، وكل كتابة محكومة بالدور (Developer+ لكتابات السياسة والحاجز). فقط حركة الترحيل /v1/* الخاصة بك تستخدم مفتاح sk-orca-…؛ وفقط خطّافات البوابة /api/v1/firewall/* تستخدم الرمز ضمن نطاق بوابة جدار الحماية.

5. الامتثال والإقامة والبيانات

أي أطر مغطّاة؟

يشمل الكتالوج SOC 2، HIPAA، GDPR، UK GDPR، قانون الذكاء الاصطناعي الأوروبي EU AI Act، ISO 27001، ISO 42001، NIST AI RMF، PCI DSS، CCPA، GLBA، قائمة OWASP العشر لتطبيقات LLM (كتخطيط تحكّم)، إضافة إلى ملفات إقليمية (PIPL، APPI، PIPA، LGPD، PIPEDA، DPDP، APPs الأسترالية، PDPA السنغافوري، DORA، وعدة قوانين ولايات أمريكية). تصفّح الكتالوج، والحزم، والجاهزية — كلها Member، مجاناً — عند /api/compliance/*.

لماذا التثبيت/التقرير محكوم؟

التصفّح مجاني؛ تثبيت حزمة، وتوليد تقرير، والانتقال إلى الإنتاج، وضبط الإقامة تتطلب Admin لمساحة العمل وخطة مدفوعة (محكوم من الخادم). تثبيت حزمة (POST /api/compliance/packs/:key/install) يجسّد حواجز حماية + سياسات جدار حماية حقيقية يمكنك تحريرها بعد ذلك.

هل تقارير الامتثال قابلة للتحقّق؟

نعم. التقرير موقّع بـ Ed25519 + SHA-256 وقابل للتحقّق علناً: اجلب المفتاح العام (GET /api/public/compliance/pubkey)، تحقّق من تقرير (POST /api/public/compliance/verify)، أو سلّم مدقّقاً رابط مشاركة (GET /api/public/compliance/share/:token). التصديرات CSV / JSON / PDF.

ماذا تثبّت إقامة البيانات فعلاً؟

إنها منطقة أثر تقرير الامتثال (us، eu، uk، ap، cn، global)، قابلة للضبط عبر PUT /api/compliance/residency (Admin)؛ تُحجب القراءة عبر المناطق. إنها ليست تثبيتاً جغرافياً لبيانات استدلالك. انظر المسؤولية المشتركة.

كم تُحفظ السجلات، وكيف أحذف بياناتي؟

يبلغ الاحتفاظ بسجل الطلبات افتراضياً 30 يوماً ويُقصّ من الخادم إلى حدّ أقصى صارم قدره 180 يوماً. يُحتجز حذف الحساب لنافذة سماح (افتراضياً 30 يوماً) قبل تشغيل تطهير PII غير قابل للرجوع؛ يطهّر ذلك التطهير تتالياً حمولات سجل طلبات Mongo، ومطابقات حواجز الحماية، وأحداث جدار الحماية المنسوبة إليك. أرشفة مساحة عمل تطهّر تتالياً نفس المجموعات الثلاث لتلك المساحة. انظر تعرّض PII.

رمز 400 من تحكّم أمني ليس خطأً في مطالبتك. إنها سياسة تؤدي عملها. لا تُعِد المحاولة — هذه الرموز skip-retry. تتبّع القاعدة، ثم قرّر ما إذا كنت ستصلح الاستدعاء أو ترخي السياسة: لماذا حُجب؟.

6. ما زلت عالقاً؟

رموز الأخطاء

كل حجب وتعليق ورفض يمكن أن تعيده البوابة.

لماذا حُجب؟

اقرأ الرمز، افتح التغذية الصحيحة، اعثر على القاعدة بالضبط.

واجهة برمجة حواجز الحماية

المسارات والأدوار والحمولات لسياسات المحتوى.

واجهة برمجة جدار الحماية

مسارات وحدة التحكم والبوابة لحوكمة الإجراءات.

واجهة برمجة الامتثال

نقاط نهاية الكتالوج، والتثبيت، والتقرير، والإقامة.

المسرد

كل مصطلح مستخدم عبر وثائق انعدام الثقة.

للتهديدات التي توقفها هذه التحكّمات، ابدأ من نموذج التهديد. لخط أساس نظيف، اتبع خط أساس الوكلاء الآمنين.

​1. الأسئلة الشائعة حول أمان وكيل الذكاء الاصطناعي — ابدأ من هنا

​2. حواجز الحماية — فحص المحتوى

​3. جدار الحماية — إجراءات الوكيل

​4. MCP والمفاتيح ووصول البوابة

​5. الامتثال والإقامة والبيانات

​6. ما زلت عالقاً؟

رموز الأخطاء

لماذا حُجب؟

واجهة برمجة حواجز الحماية

واجهة برمجة جدار الحماية

واجهة برمجة الامتثال

المسرد

1. الأسئلة الشائعة حول أمان وكيل الذكاء الاصطناعي — ابدأ من هنا

2. حواجز الحماية — فحص المحتوى

3. جدار الحماية — إجراءات الوكيل

4. MCP والمفاتيح ووصول البوابة

5. الامتثال والإقامة والبيانات

6. ما زلت عالقاً؟