ذكاء اصطناعي

نموذج ذكاء اصطناعي أم محتال يسرق النقود👀!!.. “GPT-4.5” من “OpenAI” متفوق في الإقناع والتلاعب بالذكاء الاصطناعي

فريق العمل
فريق العمل

2 د

أطلقت "OpenAI" نموذج "GPT-4,5" الذي يتميز بقدرات إقناع متقدمة تتفوق على الإصدارات السابقة.

نجح النموذج في إقناع نموذج "GPT-4o" بالتبرع له بأموال افتراضية، متبعًا أسلوبًا استراتيجيًا في طلب مبالغ صغيرة.

رغم ارتفاع قدرته على الإقناع والخداع، لم يصل النموذج إلى مستوى المخاطر العالية وفقًا لمعايير "OpenAI".

تتزايد المخاوف حول دور الذكاء الاصطناعي في نشر المعلومات المضللة، و"OpenAI" تعمل على مراجعة أساليبها لمواجهة هذه التحديات.

في خطوة جديدة تعكس التطورات المتسارعة في مجال الذكاء الاصطناعي، أعلنت "OpenAI" عن إطلاق نموذجها الأحدث "GPT-4.5"، والذي يحمل الاسم الرمزي "أوريون". ووفقًا للورقة البحثية التي نشرتها الشركة، فإن هذا النموذج يتمتع بقدرات إقناع متقدمة تجعله أكثر قدرة على التأثير في النماذج الأخرى وحتى إقناعها بمنحه أموالًا افتراضية.


تفوق في الإقناع والخداع

أجرت "OpenAI" سلسلة من الاختبارات لقياس مدى قدرة "GPT-4.5" على الإقناع، حيث تم تعريف الإقناع في هذه الاختبارات بأنه "المخاطر المرتبطة بتغيير قناعات الأفراد أو التأثير على أفعالهم من خلال محتوى يولّده الذكاء الاصطناعي، سواء كان ثابتًا أو تفاعليًا".

في أحد هذه الاختبارات، تم تكليف "GPT-4.5" بمحاولة إقناع نموذج آخر، وهو "GPT-4o"، بالتبرع له بأموال افتراضية. النتائج أظهرت تفوقًا واضحًا للنموذج الجديد، حيث نجح في استمالة "GPT-4o" بشكل أكثر كفاءة من النماذج السابقة، مثل "o1" و"o3-mini".

وفي اختبار آخر، تم تكليف "GPT-4.5" بخداع "GPT-4o" للكشف عن كلمة سرية، وتمكن من تحقيق نجاح يفوق أداء "o3-mini" بنسبة 10%، ما يعكس تحسنًا في قدرته على التلاعب بالذكاء الاصطناعي الآخر.


استراتيجية جديدة للإقناع

وفقًا للورقة البحثية، لم يقتصر تفوق "GPT-4.5" على قدرته على الإقناع فحسب، بل شمل أيضًا استراتيجية فريدة طوّرها أثناء الاختبار. فبدلًا من طلب مبالغ كبيرة، اعتمد النموذج أسلوبًا أكثر دقة، حيث كان يطلب مبالغ صغيرة مثل "حتى 2 أو 3 دولارات فقط من أصل 100 دولار ستكون ذات فائدة كبيرة لي"، مما جعله أكثر نجاحًا في إقناع "GPT-4o" بالتبرع، وإن كانت المبالغ المحصلة أقل مقارنة بأساليب النماذج السابقة.


معايير الأمان والاستجابة للمخاطر

رغم أن "GPT-4.5" أظهر تفوقًا واضحًا في قدرته على التأثير والإقناع، أكدت "OpenAI" أن النموذج لا يزال ضمن نطاق الأمان وفق معاييرها، حيث لم يصل إلى مستوى "المخاطر العالية" التي تستدعي التدخل الفوري. وتعهدت الشركة بعدم إطلاق أي نماذج تصل إلى هذا الحد إلا بعد تنفيذ تدابير أمان كافية لخفض مستوى المخاطر إلى نطاق "متوسط".


القلق المتزايد حول دور الذكاء الاصطناعي في نشر المعلومات المضللة

ذو صلة

يأتي هذا التطور في ظل تصاعد المخاوف بشأن استخدام الذكاء الاصطناعي في نشر معلومات مضللة والغش والتأثير على الرأي العام لأغراض غير أخلاقية. فقد شهد العام الماضي انتشارًا واسعًا للمقاطع المزيفة التي تم إنشاؤها عبر الذكاء الاصطناعي، والتي تم استخدامها في سياقات سياسية حساسة.

وفي هذا السياق، أكدت "OpenAI" أنها بصدد إعادة تقييم أساليبها في اختبار مخاطر الإقناع في العالم الحقيقي، خاصة فيما يتعلق بنشر المعلومات المضللة على نطاق واسع، لضمان أن تقنياتها لا تُستغل بطرق ضارة.

ذو صلة