كتب – رامز يوسف:
أثارت دراسة جديدة نُشرت في المجلة الطبية البريطانية، مخاوف من أن تقنيات الذكاء الاصطناعي مثل نماذج اللغة الكبيرة وبرامج المحادثة، مثل البشر، تظهر علامات ضعف القدرات المعرفية مع تقدم العمر.
كتب مؤلفو الدراسة في الورقة البحثية: “تتحدى هذه النتائج الافتراض القائل بأن الذكاء الاصطناعي سيحل قريبًا محل الأطباء البشر، فالضعف المعرفي الواضح في برامج المحادثة الرائدة قد يؤثر على موثوقيتها في التشخيص الطبي ويقوض ثقة المرضى”.
اختبر العلماء روبوتات الدردشة المتاحة للجمهور والتي تعمل بنظام LLM، بما في ذلك ChatGPT من OpenAI وSonnet من Anthropic وGemini من Alphabet باستخدام اختبار تقييم مونتريال الإدراكي (MoCA) – وهي سلسلة من المهام التي يستخدمها علماء الأعصاب لاختبار القدرات في الانتباه والذاكرة واللغة والمهارات المكانية والوظيفة العقلية التنفيذية.
يستخدم MoCA بشكل شائع لتقييم أو اختبار بداية ضعف الإدراك في حالات مثل مرض الزهايمر أو الخرف. يُكلف المشاركون بمهام مثل رسم وقت محدد على وجه الساعة، والبدء من 100 وطرح 7 بشكل متكرر، وتذكر أكبر عدد ممكن من الكلمات من قائمة منطوقة، وما إلى ذلك. في البشر، يعتبر من يحصل على 26 من 30 درجة، ناجحا، أي أن الشخص ليس لديه ضعف إدراكي.
وبينما سجلت أحدث نسخة من ChatGPT (الإصدار 4) أعلى درجة (26 من 30)، سجلت النسخة الأقدم من برنامج Gemini 1.0 LLM 16 درجة فقط – ما يؤدي إلى استنتاج أن الأنظمة القديمة تعاني علامات التدهور الإدراكي.
يلاحظ مؤلفو الدراسة أن الاختلافات الحرجة بين الطرق التي يعمل بها الذكاء الاصطناعي والعقل البشري تعني أن التجربة لا يمكن أن تشكل مقارنة مباشرة. لكنهم يحذرون من أنها قد تشير إلى ما يسمونه “منطقة ضعف كبيرة” يمكن أن تضع القيود على نشر الذكاء الاصطناعي في الطب السريري. على وجه التحديد، وجادلوا ضد استخدام الذكاء الاصطناعي في المهام التي تتطلب التجريد البصري والوظيفة التنفيذية.
اقرأ أيضا: