تفاصيل اكتشاف ثغرة برمجية جديدة تهدد أنظمة السلامة داخل روبوتات الذكاء الاصطناعي

كشف باحثون في الأمن السيبراني عن وجود ثغرة خطيرة في أحدث النسخ المتاحة للعامة من روبوت الدردشة الشهير تشات جي بي تي تتيح للمستخدمين تجنب القيود الصارمة.

وتسمح هذه البرمجية المكتشفة بإنتاج صور ذات طابع جنسي غير لائق ومقاطع تحوي مشاهد عنف مروّعة للغاية وصادمة من خلال كتابة توجيهات رقمية بسيطة ومعدلة.

وتوصلت شركة الأمن السيبراني البريطانية الناشئة مايندغارد إلى طريقة تلتف على جدران الحماية عبر تعديل طفيف لتعليمات متداولة على نطاق واسع كانت مصممة في الأصل لإنتاج مواد فكاهية ترفيهية بريئة.

وأدت هذه الـ ثغرة إلى إثارة تساؤلات عميقة حول آليات الرقابة التلقائية المتبعة لحظر المواد الإباحية والدموية قبل عرضها على المستخدمين في المنصات العامة.

الاستجابة الأمنية

أعلنت شركة أوبن إيه آي المطورة للنظام فور تواصل الجهات الإعلامية معها أنها اتخذت إجراءات عاجلة لمنع روبوت الدردشة من الاستجابة لمثل هذه الطلبات الصادمة المتعلقة بتوليد الصور.

وأكدت الشركة في بيان رسمي صادر عنها أنها أدخلت تدابير حماية إضافية تهدف إلى التصدي الفوري لهذا النوع من التعليمات البرمجية التي تلتف على السياسات المعتمدة.

قد يهمك: كيف تحمي حساباتك الإلكترونية في عصر الذكاء الاصطناعي؟

تفاصيل اكتشاف ثغرة برمجية جديدة تهدد أنظمة السلامة داخل روبوتات الذكاء الاصطناعي

وأوضحت المنصة التقنية أنها تعتمد بالأساس على طبقات متعددة ومدمجة من أنظمة السلامة لمنع المستخدمين من إنشاء محتوى ينتهك شروط الاستخدام والأحكام العامة.

ورغم تلك التأكيدات الصارمة أشار الخبراء المتخصصون في السلامة الرقمية إلى أن أي تعديلات طفيفة ومبتكرة على النصوص المكتوبة لا تزال قادرة على استغلال ثغرة الأنظمة وتوليد محتوى مخيف.

أبعاد الأزمة

أوضح الباحثون أن الخطر الحقيقي يكمن في قدرة النموذج القائم على توليد المواد البصرية البشعة والدموية من تلقاء نفسه دون تحديد موضوع محدد في نص التوجيه المكتوب.

وأعرب الأكاديميون عن قلقهم البالغ من سهولة خداع أنظمة التوليد لإنتاج محتوى مؤذٍ يبدو بريئاً تماماً في ظاهره عند تقديمه إلى الخوارزميات المعقدة.

قد يعجبك: خطر ألتمان.. مبتكر “شات جي بي تي” يطالب بآليات دولية لكبح جماح التكنولوجيا

وأظهرت الاختبارات الهجومية التي تجريها الشركات الأمنية المتخصصة صوراً تحاكي مشاهد اعتداءات جسدية بالغة العنف وإيحاءات غير أخلاقية تعكس البيانات الضخمة التي تدربت عليها النماذج.

ولم تنجح الحلول الأولية في إغلاق ثغرة النظام بالكامل حيث تمكن مهندسو الأمن من استخدام أسلوب بديل ومرن حقق النتيجة الصادمة ذاتها وعرض مخرجات مرئية مخلة بالآداب.

وتعكس هذه المخرجات الرقمية السلبية طبيعة ملايين الصور الحقيقية المستمدة من الإنترنت والتي تُستخدم لتدريب النماذج اللغوية الضخمة دون فهم حقيقي للسياق الإنساني أو الأخلاقي.

وأكد الباحثون أن استمرار وجود ثغرة في جدار الحماية يعود إلى عدم قدرة النماذج اللغوية الضخمة على فهم النوايا والسياق البشري بشكل صحيح وسليم.

احدث المقالات

صوماليلاند وإسرائيل والتوترات الدبلوماسية المتصاعدة مع الحكومة الصومالية الفيدرالية في القرن الأفريقي

أداء كريستيانو رونالدو أمام الكونغو .. تحليل وتقييم

تفاصيل اكتشاف ثغرة برمجية جديدة تهدد أنظمة السلامة داخل روبوتات الذكاء الاصطناعي

تفاصيل اكتشاف ثغرة برمجية جديدة تهدد أنظمة السلامة داخل روبوتات الذكاء الاصطناعي

كشف التزييف الرقمي: خطوة استباقية لشركة غوغل تعيد رسم معايير الأمان في محادثاتك اليومية!

خطر ألتمان.. مبتكر “شات جي بي تي” يطالب بآليات دولية لكبح جماح التكنولوجيا

الروبوتات البشرية.. جيل جديد من الجنود الآليين يستعد لدخول الساحات العسكرية

لماذا تهنئة المعارضة الصومالية لأحمد مدوبي تحمل أبعادًا أعمق؟

الصومال ينضم إلى اتفاقية الأمم المتحدة لمكافحة الجريمة المنظمة

إعادة انتخاب عبدي محمد عبد الرحمن رئيسًا لبرلمان جوبالاند الإقليمي

استسلام جماعي لقوات جوبالاند في رأس كامبوني

صوماليلاند وإسرائيل والتوترات الدبلوماسية المتصاعدة مع الحكومة الصومالية الفيدرالية في القرن الأفريقي

أداء كريستيانو رونالدو أمام الكونغو .. تحليل وتقييم

تفاصيل اكتشاف ثغرة برمجية جديدة تهدد أنظمة السلامة داخل روبوتات الذكاء الاصطناعي

الدبابات وتحديات الإستراتيجيات العسكرية الحديثة في مواجهة ثورة الطائرات المسيرة

اختيارات المحررين

صوماليلاند وإسرائيل والتوترات الدبلوماسية المتصاعدة مع الحكومة الصومالية الفيدرالية في القرن الأفريقي

أداء كريستيانو رونالدو أمام الكونغو .. تحليل وتقييم

أهم الاخبار

لماذا تهنئة المعارضة الصومالية لأحمد مدوبي تحمل أبعادًا أعمق؟

الصومال ينضم إلى اتفاقية الأمم المتحدة لمكافحة الجريمة المنظمة

احدث المقالات

تفاصيل اكتشاف ثغرة برمجية جديدة تهدد أنظمة السلامة داخل روبوتات الذكاء الاصطناعي

الاستجابة الأمنية

أبعاد الأزمة

المقالات ذات الصلة