كشف باحثون في الأمن السيبراني عن وجود ثغرة خطيرة في أحدث النسخ المتاحة للعامة من روبوت الدردشة الشهير تشات جي بي تي تتيح للمستخدمين تجنب القيود الصارمة.
وتسمح هذه البرمجية المكتشفة بإنتاج صور ذات طابع جنسي غير لائق ومقاطع تحوي مشاهد عنف مروّعة للغاية وصادمة من خلال كتابة توجيهات رقمية بسيطة ومعدلة.
وتوصلت شركة الأمن السيبراني البريطانية الناشئة مايندغارد إلى طريقة تلتف على جدران الحماية عبر تعديل طفيف لتعليمات متداولة على نطاق واسع كانت مصممة في الأصل لإنتاج مواد فكاهية ترفيهية بريئة.
وأدت هذه الـ ثغرة إلى إثارة تساؤلات عميقة حول آليات الرقابة التلقائية المتبعة لحظر المواد الإباحية والدموية قبل عرضها على المستخدمين في المنصات العامة.
الاستجابة الأمنية
أعلنت شركة أوبن إيه آي المطورة للنظام فور تواصل الجهات الإعلامية معها أنها اتخذت إجراءات عاجلة لمنع روبوت الدردشة من الاستجابة لمثل هذه الطلبات الصادمة المتعلقة بتوليد الصور.
وأكدت الشركة في بيان رسمي صادر عنها أنها أدخلت تدابير حماية إضافية تهدف إلى التصدي الفوري لهذا النوع من التعليمات البرمجية التي تلتف على السياسات المعتمدة.
قد يهمك: كيف تحمي حساباتك الإلكترونية في عصر الذكاء الاصطناعي؟

وأوضحت المنصة التقنية أنها تعتمد بالأساس على طبقات متعددة ومدمجة من أنظمة السلامة لمنع المستخدمين من إنشاء محتوى ينتهك شروط الاستخدام والأحكام العامة.
ورغم تلك التأكيدات الصارمة أشار الخبراء المتخصصون في السلامة الرقمية إلى أن أي تعديلات طفيفة ومبتكرة على النصوص المكتوبة لا تزال قادرة على استغلال ثغرة الأنظمة وتوليد محتوى مخيف.
أبعاد الأزمة
أوضح الباحثون أن الخطر الحقيقي يكمن في قدرة النموذج القائم على توليد المواد البصرية البشعة والدموية من تلقاء نفسه دون تحديد موضوع محدد في نص التوجيه المكتوب.
وأعرب الأكاديميون عن قلقهم البالغ من سهولة خداع أنظمة التوليد لإنتاج محتوى مؤذٍ يبدو بريئاً تماماً في ظاهره عند تقديمه إلى الخوارزميات المعقدة.
قد يعجبك: خطر ألتمان.. مبتكر “شات جي بي تي” يطالب بآليات دولية لكبح جماح التكنولوجيا

وأظهرت الاختبارات الهجومية التي تجريها الشركات الأمنية المتخصصة صوراً تحاكي مشاهد اعتداءات جسدية بالغة العنف وإيحاءات غير أخلاقية تعكس البيانات الضخمة التي تدربت عليها النماذج.
ولم تنجح الحلول الأولية في إغلاق ثغرة النظام بالكامل حيث تمكن مهندسو الأمن من استخدام أسلوب بديل ومرن حقق النتيجة الصادمة ذاتها وعرض مخرجات مرئية مخلة بالآداب.
لمعرفة المزيد: كشف التزييف الرقمي: خطوة استباقية لشركة غوغل تعيد رسم معايير الأمان في محادثاتك اليومية!

وتعكس هذه المخرجات الرقمية السلبية طبيعة ملايين الصور الحقيقية المستمدة من الإنترنت والتي تُستخدم لتدريب النماذج اللغوية الضخمة دون فهم حقيقي للسياق الإنساني أو الأخلاقي.
وأكد الباحثون أن استمرار وجود ثغرة في جدار الحماية يعود إلى عدم قدرة النماذج اللغوية الضخمة على فهم النوايا والسياق البشري بشكل صحيح وسليم.






