لا تطلب من ChatGPT أن يختصر الإجابة.. دراسة تؤكد “هلوسة” الذكاء الاصطناعي في الإجابات المختصرة!

2 د
تحذر دراسة من طلب إجابات مختصرة من الذكاء الاصطناعي لزيادة الدقة.
تنشأ "الهلوسة" عند تقصير الإجابات، مما يؤدي إلى معلومات خاطئة.
النماذج الذكية تفضل الاختصار على الدقة في الأسئلة الغامضة.
المستخدمون يفضلون النماذج السلسة، لكنها ليست دائماً الأكثر دقة.
يقترح السماح بالتفصيل لتقليل الأخطاء في الإجابات المختصرة.
هل تطلب من روبوتات الدردشة الإلكترونية إجابات قصيرة وواضحة؟ قد يكون هذا السبب في حصولك على إجابات خاطئة!
كثيراً ما نميل لاستخدام الأدوات الذكية مثل روبوتات الدردشة في البحث عن معلومات بسيطة وسريعة، لكن دراسة جديدة تحذّر من طلب إجابات مختصرة من أدوات الذكاء الاصطناعي؛ فهذا قد يزيد من احتمالية ظهور معلومات خاطئة وغير دقيقة.
أجرت شركة "Giskard" الفرنسية المتخصصة في اختبار أنظمة الذكاء الاصطناعي دراسة موسعة، خلصت نتائجها إلى أن إعطاء نماذج الذكاء الاصطناعي توجيهات واضحة تطالبها بتقصير وإيجاز الإجابات، يمكن أن يدفعها نحو ما يُعرف بـ "الهلوسة" — وهذا مصطلح تقني يشير إلى أن النموذج الذكي يقدم حقائق وهمية أو معلومات من صنع خياله، وكأنه "يتوهمها" بالفعل.
ويعود السبب في هذه الظاهرة، وفق الدراسة، إلى ضعف المساحة التي تُمنح للنماذج الذكية لتفنيد الافتراضات الخاطئة أو تقديم تفسيرات واضحة عندما يُطلب منها الإجابة بإيجاز. فعندما تطلب إجابات مختصرة، يكون الذكاء الاصطناعي مضطراً للتركيز على الاختصار بدلاً من الدقة والتفصيل، مما يجعله يقع بسهولة في أخطاء منطقية، خصوصاً في المواضيع الغامضة أو المثيرة للجدل.
وقد اختبرت الدراسة عدداً من أشهر النماذج المستخدمة حالياً، مثل GPT-4o التابع لشركة OpenAI ونموذج Mistral Large، وكذلك نموذج Claude 3.7 Sonnet المطور من Anthropic، وجميع هذه النماذج أظهرت انخفاضاً واضحاً في مستويات الدقة عندما طولبت بالإيجاز في جوابها عن أسئلة تحمل شيئاً من الغموض أو الافتراضات الخاطئة.
وأكثر ما يدعو للانتباه في نتائج الدراسة هذه أن النماذج الذكية تتأثر كذلك بنبرة المستخدم نفسه. فعند توجيه أسئلة حساسة بأسلوب واثق، يقل احتمال قيام النموذج بتصحيح معلومات خاطئة أو رفض الافتراضات المغلوطة. ولعل الأغرب من ذلك هو أن النماذج التي يفضّلها المستخدمون (لأسلوبها السلس أو المحبب) لم تكن دائماً الأكثر دقة بين النماذج التي تم اختبارها.
من هنا تكشف لنا هذه الدراسة عن تحديات يُواجهها العاملون في تطوير تطبيقات الدردشة الذكية، تحديداً التوازن الصعب بين تحقيق تجربة مستخدم سلسة ومريحة من جهة، وبين الالتزام بمعايير الدقة والموثوقية من جهة أخرى.
في ضوء هذه النتائج المثيرة، ربّما يستحسن على مستخدمي الأدوات الذكية ألا يطلبوا دائماً "إجابة مختصرة"، وأن يسمحوا للنماذج الذكية ببعض التفصيل لتقليل الأخطاء. كما يجدر بمطوّري هذه النماذج أخذ هذه المسألة بعين الاعتبار، وربما تضمين توضيحات أو تحذيرات للمستخدمين تنبّههم إلى احتمالية نقص الدقة في الإجابات شديدة الاختصار. يبقى التوفيق بين سهولة الاستخدام وجودة الإجابات واضحاً كهدف مُلحّ في القطاع التقني اليوم.