1. الأسئلة الشائعة حول أمان وكيل الذكاء الاصطناعي — ابدأ من هنا
خريطة من 30 ثانية لأي تحكّم يجيب أي سؤال:| أنت تسأل عن… | المستوى | اقرأ |
|---|---|---|
| النص في المطالبات أو الاستجابات (PII، الأسرار، jailbreaks) | حواجز الحماية | حواجز الحماية |
| استدعاءات الأدوات، MCP، egress، المهارات | جدار الحماية | جدار الحماية |
أيّهما أُطلق على 400 | أيّهما | لماذا حُجب؟ |
2. حواجز الحماية — فحص المحتوى
ماذا يحدث إذا لم يُحَل أي حاجز حماية على طلب؟
ماذا يحدث إذا لم يُحَل أي حاجز حماية على طلب؟
guardrail_id صريح على المفتاح (إن كان موجوداً
ومفعّلاً) ← وإلا حاجز حماية is_default لمساحة العمل ← وإلا لا فرض.
الربط الصريح المعطّل هو مفتاح الإطفاء — وهو لا يتراجع إلى
الافتراضي. مع عدم حل أي شيء، يكون الطلب متطابقاً بايت ببايت مع مساحة
عمل لم تفعّل الميزة أبداً.هل يكلّفني الطلب المحجوب حصة؟
هل يكلّفني الطلب المحجوب حصة؟
block يعيد 400 guardrail_blocked ولا يكلّف حصة — حجب
مرحلة الإدخال يُطلق قبل القياس؛ وحجب مرحلة الإخراج يردّ الحصة
المستهلكة مسبقاً. وهو أيضاً مُعلَّم skip-retry: إعادة تشغيل نفس
المطالبة يحجب مجدداً فحسب.ما أنواع القواعد والإجراءات الموجودة؟
ما أنواع القواعد والإجراءات الموجودة؟
keyword، regex، pii، max_chars، external،
llm_judge، grounding. الإجراءات: block (رفض)، mask (تنقيح
وتمرير)، flag (تسجيل فقط، بلا تغيير في حركة المرور). المراحل:
input، output، both. انظر حواجز الحماية
لكل منها.أي كيانات PII تُكتشف، وكيف يبدو القناع؟
أي كيانات PII تُكتشف، وكيف يبدو القناع؟
email، phone، credit_card، ssn،
ip، iban، mac_address، jwt، aws_access_key، api_key_openai،
bitcoin_address، إضافة إلى الأنواع الإقليمية (jp_mynumber، kr_rrn،
cn_resident_id). إجراء mask يعرض وسماً مُصنّفاً —
jane@acme.com ← [EMAIL]، ورقم SSN ← [SSN]. يمكنك طبقة حتى
25 كيان regex مخصص لكل قاعدة (مع جمع تحقّق Luhn اختياري) وتجاوز
الإجراء لكل كيان عبر entity_actions.هل يُفرض إخفاء الإخراج على الاستجابات المتدفقة؟
هل يُفرض إخفاء الإخراج على الاستجابات المتدفقة؟
ماذا يكلّف حَكَم LLM؟
ماذا يكلّف حَكَم LLM؟
keyword / regex / pii / max_chars لا تجري أي استدعاء
نموذج ولا تفوتر شيئاً. قاعدة llm_judge تجري فحصاً دلالياً عبر نموذج
مساحة العمل (محدوداً بـ judge_timeout_ms، fail-open افتراضياً)
وتُفوتر كـبند فرعي للحَكَم منفصل. قاعدة grounding تسجّل أمانة
الإجابة مقابل المصادر المسترجعة للطلب (العتبة الافتراضية 0.7) بنفس
الطريقة.هل يمكنني رؤية ما طابقته القاعدة فعلاً؟
هل يمكنني رؤية ما طابقته القاعدة فعلاً؟
GET /api/guardrail/match، Member). يسجّل كل
صف نوع القاعدة، والإجراء، والمرحلة، وسلسلة تفصيل — والسلسلة الفرعية
المطابقة فقط إذا كان “Log raw content” مفعّلاً لذلك الحاجز (مطفأ
افتراضياً، الموقف المحافظ على الخصوصية). حجب خاطئ؟ علّمه كإيجابية
كاذبة (POST /api/guardrail/match/:id/mark-fp، Admin).هل تفحصون التبعيات بحثاً عن CVEs معروفة؟
هل تفحصون التبعيات بحثاً عن CVEs معروفة؟
block / mask /
flag التي تؤلّفها مباشرة. اربط ماسحاً تحت Integrations لتشغيلها.3. جدار الحماية — إجراءات الوكيل
كيف يختلف جدار الحماية عن حواجز الحماية في الحل؟
كيف يختلف جدار الحماية عن حواجز الحماية في الحل؟
firewall_policy_id / guardrail_id)
ويتشاركان تراجع افتراضي مساحة العمل. انظر
حواجز الحماية مقابل جدار الحماية.ما الأحكام والأسطح؟
ما الأحكام والأسطح؟
allow، audit، deny، sanitize، pending_approval،
cap_cost. الـ default_verdict هو allow / audit / deny
(audit افتراضياً). الأسطح: inbound (الأدوات المُعلَن عنها)،
response (استدعاءات tool_calls المُصدَرة من النموذج)، mcp
(استدعاء tools/call)، egress (host/IP/CIDR صادر). يفكّ
مسرد الأحكام كلاً منها.هل ينظّف `sanitize` ما تعيده أداة؟
هل ينظّف `sanitize` ما تعيده أداة؟
sanitize ينقّح السلاسل الفرعية
المطابقة من وسائط استدعاء الأداة فقط، وليس أبداً المحتوى الذي
تعيده أداة. على سطح inbound (لا وسائط وقت استدعاء بعد) يتصاعد
sanitize إلى deny.ماذا تفعل مستويات الاستقلالية؟
ماذا تفعل مستويات الاستقلالية؟
autonomy_* حقيقية قابلة
للتحرير:•
balanced (البداية الموصى بها) — audit افتراضي، deny
لـ shell المدمّر، PII Shield في وضع التدقيق فقط (يعلّم PII).•
tight — حجب افتراضي، deny لـ shell المدمّر، deny لأدوات الجلب
على شكل SSRF، حواجز PII Shield + Secrets Blocker مفروضة.•
permissive — مراقبة فقط.تراجع بنقرة واحدة يستعيد الحالة السابقة من لقطة التدقيق التي كتبها التطبيق. إنها خطوة واحدة — التراجع غير متاح بمجرد أن يتجاوز تطبيق لاحق (أو تحرير سياسة يدوي) تلك اللقطة. انظر أوضاع الفرض.
هل يحجب إعداد SSRF المسبق عناوين IP الخاصة وبيانات السحابة الوصفية؟
هل يحجب إعداد SSRF المسبق عناوين IP الخاصة وبيانات السحابة الوصفية؟
tight يرفض
أسماء الأدوات الشائعة على شكل الجلب (http_fetch، web_search،
fetch_url، request). للرفض حسب الوجهة — نطاقات RFC-1918، عناوين
IP لبيانات السحابة الوصفية، CIDRs محددة — ألّف قاعدة رفض host/CIDR
خاصة بك على سطح egress. لا يأتي أي إعداد مسبق بقواعد CIDR لك. انظر
Egress وتسريب البيانات.كيف أطرح سياسة دون كسر حركة المرور؟
كيف أطرح سياسة دون كسر حركة المرور؟
audit، مُسبِقةً السبب بـ [shadow] would …. راقب عرضي
Events وRuns، ثم أطفئ الظل لتبدأ الفرض. وضع observe على
مستوى مساحة العمل (firewall_observe_mode) هو قرص الاكتشاف المكمّل —
يسجّل الاستدعاءات غير المغطّاة كثغرات في Discovered Tools.كيف تعمل الموافقة البشرية (HITL)؟
كيف تعمل الموافقة البشرية (HITL)؟
pending_approval يعيد 400 firewall_approval_pending مع معرّف
موافقة. يحلّها مراجِع من وحدة التحكم (Developer+) أو عبر استدعاء
webhook مُوقَّع بـ HMAC
(POST /api/v1/firewall/approvals/:id/callback). يستطلع الوكيل
GET /api/v1/firewall/approvals/:id ويعيد تقديم الاستدعاء الأصلي
بترويسة X-OrcaRouter-Firewall-Approval أحادية الاستخدام. انظر
استدعاءات الأدوات الخطرة.عمَّ يبحث كشف الشذوذ؟
عمَّ يبحث كشف الشذوذ؟
retry_loop وnovel_path (انتقال من أداة إلى
أداة لم يُرَ من قبل). التغذية قابلة للقراءة من قبل Member؛ يمكنك تأجيل
شذوذ لمدة تصل إلى 7 أيام. انظر
الاستقلالية المفرطة.4. MCP والمفاتيح ووصول البوابة
كيف تُحكم خوادم MCP؟
كيف تُحكم خوادم MCP؟
name، endpoint، auth_mode بقيمة
none/bearer/oauth/basic، بيانات اعتماد مشفّرة) وتقيّم بوابة
MCP كل tools/call على سطح mcp قبل الإرسال. تُتتبّع الصحة
(ok/degraded/down)؛ افحصها بـ
POST /api/workspace/firewall/mcp_servers/:id/probe. يضع الفحص أيضاً
خط أساس لمخطط الأدوات المُعلَن عنه للخادم — يقلب الانحراف اللاحق حالة
مخططه من verified إلى changed (إشارة “السحب من تحت الأقدام”)،
وتقوم إما بإعادة خط الأساس (موافقة) أو quarantine للخادم. فالحوكمة
هي تقييم لكل استدعاء إضافة إلى تتبّع سلامة المخطط ونطاقات مخاطر
المهارات. انظر Firewall MCP و
تسميم أدوات MCP.ماذا يحدث لمهارة خطرة أو مكتشفة آلياً؟
ماذا يحدث لمهارة خطرة أو مكتشفة آلياً؟
allow / quarantine / block. المهارة المحجوزة في الحجر
الصحي تُحتجز للموافقة؛ تبقى المهارات المكتشفة آلياً في الحجر حتى
يراجعها إنسان. يركب الوضع فوق حكم القاعدة.أي حقول مفتاح تُحكم قبضتها على الوكيل؟
أي حقول مفتاح تُحكم قبضتها على الوكيل؟
model_limits (+ model_limits_enabled)، allow_ips،
credit_limit_usd (0 = غير محدود)، expired_time (-1 = أبداً)،
environment، guardrail_id، firewall_policy_id، و
is_firewall_gateway. ادمجها من أجل أقل استقلالية — انظر
النطاق والمفاتيح والسياسات.
تُخفى المفاتيح عند العرض.لماذا أحصل على 403 على `/api/v1/firewall/*`؟
لماذا أحصل على 403 على `/api/v1/firewall/*`؟
POST /evaluate، POST /evaluate_plan،
ANY /mcp) مفتاحاً بـ is_firewall_gateway=true — رمز مخصّص ضمن نطاق
بوابة جدار الحماية، وليس مفتاح الترحيل sk-orca-… الخاص بك. سكّ واحد
وقراءة نصه الصريح يتطلبان Admin+.ما الفرق بين الضبط والاستدعاء؟
ما الفرق بين الضبط والاستدعاء؟
/v1/* الخاصة بك تستخدم مفتاح sk-orca-…؛ وفقط خطّافات
البوابة /api/v1/firewall/* تستخدم الرمز ضمن نطاق بوابة جدار الحماية.5. الامتثال والإقامة والبيانات
أي أطر مغطّاة؟
أي أطر مغطّاة؟
/api/compliance/*.لماذا التثبيت/التقرير محكوم؟
لماذا التثبيت/التقرير محكوم؟
POST /api/compliance/packs/:key/install) يجسّد حواجز
حماية + سياسات جدار حماية حقيقية يمكنك تحريرها بعد ذلك.هل تقارير الامتثال قابلة للتحقّق؟
هل تقارير الامتثال قابلة للتحقّق؟
GET /api/public/compliance/pubkey)، تحقّق من
تقرير (POST /api/public/compliance/verify)، أو سلّم مدقّقاً رابط
مشاركة (GET /api/public/compliance/share/:token). التصديرات
CSV / JSON / PDF.ماذا تثبّت إقامة البيانات فعلاً؟
ماذا تثبّت إقامة البيانات فعلاً؟
us، eu، uk، ap، cn،
global)، قابلة للضبط عبر PUT /api/compliance/residency (Admin)؛
تُحجب القراءة عبر المناطق. إنها ليست تثبيتاً جغرافياً لبيانات
استدلالك. انظر
المسؤولية المشتركة.كم تُحفظ السجلات، وكيف أحذف بياناتي؟
كم تُحفظ السجلات، وكيف أحذف بياناتي؟
