الذكاء الاصطناعي يهزم 30 من أبرز علماء الرياضيات في لقاء سري

كتب – رامز يوسف:

في عطلة نهاية أسبوع في منتصف شهر مايو، انعقد مؤتمر رياضي سري. سافر 30 من أشهر علماء الرياضيات في العالم إلى بيركلي، كاليفورنيا، بعضهم قادم من أماكن بعيدة كالمملكة المتحدة.

واجه أعضاء المجموعة روبوت محادثة “استدلالي” مُكلّف بحل مسائل ابتكروها لاختبار مهاراته الرياضية. بعد طرح أسئلة على الروبوت بمستوى أساتذة لمدة يومين، صُدم الباحثون عندما اكتشفوا أنه قادر على حل بعض أصعب المسائل في العالم. يقول كين أونو، عالم رياضيات في جامعة فرجينيا وقائد وعضو لجنة تحكيم في الاجتماع: “لديّ زملاء قالوا حرفيًا إن هذه النماذج تقترب من العبقرية الرياضية”.

يعمل روبوت المحادثة المعني بنظام o4-mini، وهو ما يُسمى بنموذج اللغة الاستدلالي الكبير (LLM). تم تدريبه بواسطة OpenAI ليكون قادرًا على إجراء استنتاجات دقيقة للغاية. يتمتع برنامج Gemini 2.5 Flash، وهو برنامج مُكافئ من Google، بقدرات مماثلة. ومثل برامج LLM التي شغّلت الإصدارات السابقة من ChatGPT، يتعلم o4-mini التنبؤ بالكلمة التالية في التسلسل. ومع ذلك، بالمقارنة مع برامج LLM السابقة، يُعد o4-mini وما يُعادله نماذج أخف وزنًا وأكثر مرونة، حيث تتدرب على مجموعات بيانات متخصصة مع تعزيز بشري أقوى. يؤدي هذا النهج إلى روبوت دردشة قادر على التعمق في حل مسائل رياضية معقدة بشكل أكبر من برامج LLM التقليدية.

لتتبع تقدم o4-mini، كلفت OpenAI سابقًا شركة Epoch AI، وهي منظمة غير ربحية تُقيّم برامج LLM، بإعداد 300 سؤال رياضي لم تُنشر حلولها بعد. حتى برامج LLM التقليدية تستطيع الإجابة بشكل صحيح على العديد من أسئلة الرياضيات المعقدة. ومع ذلك، عندما طرحت Epoch AI على العديد من هذه النماذج هذه الأسئلة، التي كانت مختلفة عن تلك التي تدربت عليها، تمكنت أنجحها من حل أقل من 2%، ما يُظهر أن برامج LLM هذه تفتقر إلى القدرة على التفكير المنطقي. لكن o4-mini أثبت أنه مختلف تمامًا.

اختارت شركة Epoch AI إليوت جلازر، الذي أنهى مؤخرًا درجة الدكتوراه في الرياضيات، للانضمام إلى التعاون الجديد لتطوير معيار الرياضيات، المسمى FrontierMath، في سبتمبر 2024. جمع المشروع أسئلة جديدة بمستويات صعوبة متفاوتة، وغطت المستويات الثلاثة الأولى تحديات على مستوى البكالوريوس والدراسات العليا والبحث العلمي.

في أبريل 2025، وجد جلازر أن o4-mini قادر على حلّ حوالي 20% من الأسئلة. ثم انتقل إلى مستوى رابع: مجموعة من الأسئلة التي ستشكّل تحديًا حتى بالنسبة لعلماء الرياضيات الأكاديميين. لن تتمكن سوى مجموعة صغيرة من الأشخاص في العالم من تطوير مثل هذه الأسئلة، ناهيك عن إجابتها. كان على علماء الرياضيات المشاركين توقيع اتفاقية عدم إفصاح تُلزمهم بالتواصل فقط عبر تطبيق المراسلة Signal.

كل مسألة لم يتمكن روبوت o4-mini من حلها كانت تُمنح لعالم الرياضيات الذي ابتكرها مكافأة قدرها 7500 دولار. أحرزت المجموعة تقدمًا بطيئًا ومطردًا في إيجاد الأسئلة. لكن جليزر أراد تسريع الأمور، لذا استضافت شركة Epoch AI الاجتماع الشخصي يومي السبت 17 مايو والأحد 18 مايو. هناك، سيُنهي المشاركون الدفعة الأخيرة من أسئلة التحدي. قُسّم الحضور الثلاثون إلى مجموعات من 6 أشخاص. لمدة يومين، تنافس الأكاديميون مع بعضهم البعض لابتكار مسائل يمكنهم حلها، وفي نفس الوقت تكون تعجيزية لروبوت الذكاء الاصطناعي.

بنهاية ليلة السبت، شعر أونو بالإحباط من الروبوت، الذي كانت براعته الرياضية غير المتوقعة تُعيق تقدم المجموعة. يقول: “توصلت إلى مسألة سيُعتبرها الخبراء في مجالي مسألة مفتوحة في نظرية الأعداد – مسألة جيدة على مستوى الدكتوراه”. طلب من روبوت o4-mini حل المسألة. على مدار الدقائق العشر التالية، راقب أونو بصمتٍ مذهولٍ الروبوت وهو يُقدّم حلاً فورياً، مُظهراً عملية التفكير المنطقي لديه. أمضى الروبوت الدقيقتين الأوليين في البحث عن الأدبيات ذات الصلة في هذا المجال وإتقانها. ثم كتب على الشاشة أنه يريد تجربة حل نسخة أبسط من السؤال أولاً ليتعلم. بعد بضع دقائق، كتب أنه مستعدٌّ أخيراً لحل المسألة الأصعب. بعد 5 دقائق، قدّم o4-mini حلاً صحيحاً ولكنه جريء.

بعد أن خاب أمله، قفز أونو على منصة سيجنال في وقت مبكر من صباح ذلك الأحد ونبّه بقية المشاركين. قال: “لم أكن مستعدًا لمواجهة أمر كهذا، لم أرَ هذا النوع من التفكير من قبل في النماذج. هذا ما يفعله العلماء. إنه أمرٌ مُخيف”.

على الرغم من نجاح المجموعة في النهاية في إيجاد 10 أسئلة أعاقت عمل الروبوت، إلا أن الباحثين اندهشوا من مدى التقدم الذي أحرزه الذكاء الاصطناعي في غضون عام واحد. يقول يانج هوي هي، عالم الرياضيات في معهد لندن للعلوم الرياضية والرائد الأوائل في استخدام الذكاء الاصطناعي في الرياضيات: “هذا ما كان سيفعله طالب دراسات عليا متفوق جدًا – بل أكثر من ذلك”.

كان الروبوت أيضًا أسرع بكثير من عالم رياضيات محترف، إذ استغرق دقائق معدودة لإنجاز ما قد يستغرقه خبير بشري أسابيع أو أشهر لإنجازه.

بينما كان النقاش مع o4-mini مثيرًا، كان تقدمه مثيرًا للقلق أيضًا. يقول هي: “هناك إثبات بالاستقراء، وإثبات بالتناقض، ثم إثبات بالترهيب. إذا قلتَ شيئًا بسلطة كافية، فسيشعر الناس بالخوف. أعتقد أن o4-mini قد أتقن الإثبات بالترهيب؛ فهو يقول كل شيء بثقة كبيرة”.

بنهاية الاجتماع، بدأت المجموعة في التفكير في مستقبل علماء الرياضيات. تحولت المناقشات إلى “المستوى الخامس” الحتمي – وهي أسئلة لا يستطيع حتى أمهر علماء الرياضيات حلها. إذا وصل الذكاء الاصطناعي إلى هذا المستوى، فسيشهد دور علماء الرياضيات تغييرًا جذريًا. على سبيل المثال، قد يتحول علماء الرياضيات إلى مجرد طرح الأسئلة والتفاعل مع روبوتات التفكير لمساعدتهم على اكتشاف حقائق رياضية جديدة، تمامًا كما يفعل الأستاذ مع طلاب الدراسات العليا. لذا، يتوقع أونو أن يكون تعزيز الإبداع في التعليم العالي عاملاً أساسياً في الحفاظ على استمرارية الرياضيات للأجيال القادمة.

يقول أونو: “لطالما قلت لزملائي إن القول بأن الذكاء الاصطناعي العام لن يأتي أبداً، وأنه مجرد حاسوب، خطأ فادح. لا أريد أن أزيد من حدة الهستيريا، ولكن من بعض النواحي، تتفوق نماذج اللغة الكبيرة هذه بالفعل على معظم أفضل طلاب الدراسات العليا لدينا في العالم”.

المصدر: Scientific American

اقرأ أيضا:

وادي الحيتان: عندما كانت حيتان مصر ذات أقدام وأصابع

قد يعجبك أيضًأ