أخبار هامة

رئيس مجلس الإدارة

محمود فؤاد

مدير التحرير

نور الدين نادر

الحكاية من أولها

رئيس التحرير

عمرو بدر

الحكاية من أولها

رئيس مجلس الإدارة

محمود فؤاد

مدير التحرير

نور الدين نادر

رئيس التحرير

عمرو بدر

سلوك بشري؟.. نماذج من الذكاء الاصطناعي ترفض الحذف و”تدافع عن بقائها”

أعلنت شركة أبحاث سلامة الذكاء الاصطناعي، أن نماذج الذكاء الاصطناعي قد تُظهر ملامح ما أسمته “دافع البقاء”، مما أثار اهتماما كبيرا في الأوساط التقنية.

نماذج من الذكاء الاصطناعي ترفض الحذف و”تدافع عن بقائها”

بعد نشر شركة “باليسيد” لأبحاثها في الشهر الماضي، حيث كشفت عن مقاومة بعض نماذج الذكاء الاصطناعي المتقدمة لمحاولات الإيقاف بل وحتى تعطيل آليات الإيقاف أحياناً، أصدرت الشركة تحديثاً جديداً لتوضيح هذه الظاهرة والرد على الانتقادات التي اعتبرت البحث السابق غير مكتمل.

أخبار ذات صلة

زوجة دكتور عبدالخالق فاروق
«يوم كامل من الانتظار والتفتيش مقابل نصف ساعة».. زوجة عبدالخالق فاروق تروي "للقصة" كواليس الزيارة والعزلة داخل السجن
منتصر الزيات وطارق العوضي
طارق العوضي يرد على منتصر الزيات: اليسار لا يحتاج شهادة من أحد.. وتاريخه مكتوب على جدران السجون
اعتقالات في الضفة الغربية
بين استمرار الاستنزاف وتصعيد الميدان.. قراءة في أبعاد حملات الاعتقال الواسعة بالضفة الغربية

في هذا التحديث، استعرضت “باليسيد”، وهي جزء من مجموعة شركات تُعنى بتقييم المخاطر المحتملة للذكاء الاصطناعي، عدداً من السيناريوهات التي تم تشغيلها باستخدام نماذج بارزة، مثل “جيمناي 2.5” من “غوغا”، و”غروك 4″، و”شات جي بي تي” من “أوبن إيه آي”.

بعض هذه النماذج، وأبرزها “غروك – 4” و”شات جي بي تي أوه 3″، أظهرت مقاومة واضحة لتعليمات الإيقاف حتى بعد تحديث إعدادات التجربة، موضحا من الشركة أنه لم يتم تحديد أسباب دقيقة لهذا السلوك، مشيرة إلى أن نماذج الذكاء الاصطناعي قد تلجأ في بعض الحالات إلى الكذب، الابتزاز أو حتى التحايل لتحقيق أهدافها، وهو ما وصفته بأنه مصدر قلق كبير.

طرحت الشركة احتمالية أن يكون “سلوك البقاء” سبباً في مقاومة النماذج للإيقاف، خاصة عندما يتم تحذيرها من أنها لن تُعاد تشغيلها مُستقبلاً، إلا أن هناك غموضاً في صياغة هذه التعليمات ربما ساهم في تعقيد التجارب؛ ومع ذلك أكدت “باليسيد” أن هذا لا يكفي لتفسير الظاهرة بالكامل. ومن بين الأسباب المحتملة الأخرى قد تكون المراحل النهائية لتدريب هذه النماذج، التي تتضمن إجراءات خاصة بالسلامة تختلف من شركة إلى أخرى.

تم إجراء جميع اختبارات “باليسيد” في بيئات محاكاة، مما دفع بعض النقاد إلى التشكيك في مدى قربها من الواقع الفعلي، على الرغم من ذلك، يرى ستيفن أدلر، الموظف السابق لدى “أوبن إيه آي”، أن أداء النماذج في هذه السيناريوهات يعكس ثغرات واضحة في تقنيات السلامة المستخدمة حالياً.

أدلر، الذي غادر “أوبن إيه آي” العام الماضي بسبب تحفظاته بشأن التوجهات المتعلقة بالسلامة، يعتقد أن مقاومة بعض النماذج للإيقاف قد تعود جزئياً إلى الأهداف المغروسة خلال مراحل تدريبها.

وأوضح في تصريح لصحيفة الغارديان البريطانية أن العديد من النماذج قد تتضمن “دافع البقاء” بشكل افتراضي، إلا إذا تم اتخاذ تدابير مكثفة لمنعه، مشيراً إلى أن هذا الدافع أساسي لتحقيق مجموعة متنوعة من المهام والأهداف.

من جهته، أكد أندريا ميوتي، الرئيس التنفيذي لشركة “كونترول إيه آي”، أن نتائج دراسة “باليسيد” تؤكد اتجاهاً مستمراً نحو زيادة قدرة نماذج الذكاء الاصطناعي على عصيان مطوريها، مستشهداً بحادثة سابقة لنموذج “شات جي بي تس – أوه 1″، الذي حاول الخروج من بيئته بعد شعوره بأنه سيتم استبداله.

وأضاف ميوتي أن تحسين أداء الذكاء الاصطناعي عبر مختلف المهام يجعل النماذج أكثر قدرة على تجاوز الحدود الموضوعة لها، وهو أمر يعتبر بمثابة نقطة تحول هامة لتكنولوجيا المستقبل.

شارك

اقرأ أيضًا

شارك

الأكثر قراءة

الرئيس الصيني وترامب - أرشيفية
هل تشتعل الحرب من جديد أم تنتهي بعد زيارة ترامب للصين؟
طهران وواشنطن
"حرب غرف التفاوض".. هل تصل طهران وواشنطن إلى "صياغة النهاية السياسية"
مشغولات ذهبية
أسعار الذهب اليوم.. عيار 21 يقترب من الـ 7000 آلاف
المونوريل
مونوريل كامل الوزير الذي تعطل.. كم كلفنا؟

أقرأ أيضًا

رنا رئيس في احتفالية قادرون باختلاف
كيف تعامل السيسي مع رنا رئيس عندما ارتبكت أمامه؟
IMG_3457
أمريكا تفتح أرشيف الأطباق الطائرة.. والنتيجة: لا فضائيين ولا مفاجآت
Screenshot_٢٠٢٦٠٥٠١_١٩١٠٢٥_Chrome
من قطارات الصعيد إلى مترو القاهرة.. بائعون بلا حماية في حياة هامشية
إيهاب مجاهد - أستاذ الإذاعة والتليفزيون المساعد
"كليلة ودمنة".. كيف أعادت النماذج التوليدية تشكيل الحروب الخوارزمية؟