أعلنت شركة أبحاث سلامة الذكاء الاصطناعي، أن نماذج الذكاء الاصطناعي قد تُظهر ملامح ما أسمته “دافع البقاء”، مما أثار اهتماما كبيرا في الأوساط التقنية.
نماذج من الذكاء الاصطناعي ترفض الحذف و”تدافع عن بقائها”
بعد نشر شركة “باليسيد” لأبحاثها في الشهر الماضي، حيث كشفت عن مقاومة بعض نماذج الذكاء الاصطناعي المتقدمة لمحاولات الإيقاف بل وحتى تعطيل آليات الإيقاف أحياناً، أصدرت الشركة تحديثاً جديداً لتوضيح هذه الظاهرة والرد على الانتقادات التي اعتبرت البحث السابق غير مكتمل.
في هذا التحديث، استعرضت “باليسيد”، وهي جزء من مجموعة شركات تُعنى بتقييم المخاطر المحتملة للذكاء الاصطناعي، عدداً من السيناريوهات التي تم تشغيلها باستخدام نماذج بارزة، مثل “جيمناي 2.5” من “غوغا”، و”غروك 4″، و”شات جي بي تي” من “أوبن إيه آي”.
بعض هذه النماذج، وأبرزها “غروك – 4” و”شات جي بي تي أوه 3″، أظهرت مقاومة واضحة لتعليمات الإيقاف حتى بعد تحديث إعدادات التجربة، موضحا من الشركة أنه لم يتم تحديد أسباب دقيقة لهذا السلوك، مشيرة إلى أن نماذج الذكاء الاصطناعي قد تلجأ في بعض الحالات إلى الكذب، الابتزاز أو حتى التحايل لتحقيق أهدافها، وهو ما وصفته بأنه مصدر قلق كبير.
طرحت الشركة احتمالية أن يكون “سلوك البقاء” سبباً في مقاومة النماذج للإيقاف، خاصة عندما يتم تحذيرها من أنها لن تُعاد تشغيلها مُستقبلاً، إلا أن هناك غموضاً في صياغة هذه التعليمات ربما ساهم في تعقيد التجارب؛ ومع ذلك أكدت “باليسيد” أن هذا لا يكفي لتفسير الظاهرة بالكامل. ومن بين الأسباب المحتملة الأخرى قد تكون المراحل النهائية لتدريب هذه النماذج، التي تتضمن إجراءات خاصة بالسلامة تختلف من شركة إلى أخرى.
تم إجراء جميع اختبارات “باليسيد” في بيئات محاكاة، مما دفع بعض النقاد إلى التشكيك في مدى قربها من الواقع الفعلي، على الرغم من ذلك، يرى ستيفن أدلر، الموظف السابق لدى “أوبن إيه آي”، أن أداء النماذج في هذه السيناريوهات يعكس ثغرات واضحة في تقنيات السلامة المستخدمة حالياً.
أدلر، الذي غادر “أوبن إيه آي” العام الماضي بسبب تحفظاته بشأن التوجهات المتعلقة بالسلامة، يعتقد أن مقاومة بعض النماذج للإيقاف قد تعود جزئياً إلى الأهداف المغروسة خلال مراحل تدريبها.
وأوضح في تصريح لصحيفة الغارديان البريطانية أن العديد من النماذج قد تتضمن “دافع البقاء” بشكل افتراضي، إلا إذا تم اتخاذ تدابير مكثفة لمنعه، مشيراً إلى أن هذا الدافع أساسي لتحقيق مجموعة متنوعة من المهام والأهداف.
من جهته، أكد أندريا ميوتي، الرئيس التنفيذي لشركة “كونترول إيه آي”، أن نتائج دراسة “باليسيد” تؤكد اتجاهاً مستمراً نحو زيادة قدرة نماذج الذكاء الاصطناعي على عصيان مطوريها، مستشهداً بحادثة سابقة لنموذج “شات جي بي تس – أوه 1″، الذي حاول الخروج من بيئته بعد شعوره بأنه سيتم استبداله.
وأضاف ميوتي أن تحسين أداء الذكاء الاصطناعي عبر مختلف المهام يجعل النماذج أكثر قدرة على تجاوز الحدود الموضوعة لها، وهو أمر يعتبر بمثابة نقطة تحول هامة لتكنولوجيا المستقبل.