GPT-4.5 أول نموذج ذكاء اصطناعي يجتاز اختبار تورينج

ألان تورينج.. الأب الروحي للحاسب
ألان تورينج.. الأب الروحي للحاسب
كتب – رامز يوسف:

يقول العلماء إن نماذج اللغة الكبيرة (LLMs) تتحسن في تقليد البشر، ودللوا على ذلك بنجاح GPT-4.5 في اجتياز اختبار تورينج بتفوق واضح.

في الدراسة الجديدة، التي نُشرت على قاعدة بيانات arXiv للمطبوعات الأولية، وجد الباحثون أنه عند المشاركة في اختبار تورينج ثلاثي الأطراف، يمكن لـ GPT-4.5 أن يخدع الناس ليعتقدوا أنه إنسان بنسبة 73% من الحالات.

في حين أن فريقًا آخر من العلماء أفاد سابقًا بأن GPT-4 اجتاز اختبار تورينج ثنائي الأطراف، إلا أن هذه المرة الأولى التي يجتاز فيها نموذج LLM التكوين الأكثر تحديًا وأصالةً لـ “لعبة المحاكاة” التي ابتكرها عالم الكمبيوتر آلان تورينج.

يُعد GPT-4.5 المرشح الأبرز في هذه الدراسة، لكن 56% من المشاركين في الاختبار اعتبروا LLaMa-3.1 من Meta بشريًا أيضًا، وهو ما يفوق توقعات تورينج بأن “فرصة المُستجوب العادي في تحديد الهوية الصحيحة لن تزيد عن 70% بعد خمس دقائق من الاستجواب”.

التفوق على اختبار تورينج

الفكرة الأساسية لاختبار تورينج لا تتمحور حول إثبات قدرة الآلات على التفكير، بل حول قدرتها على تقليد البشر؛ ولذلك يُشار إلى الاختبار غالبًا باسم “لعبة المحاكاة”. كان اقتراح تورينج الأصلي أن يطرح “مُستجوب” بشري أسئلة على كيانين غير مرئيين، أحدهما بشري والآخر حاسوب. ومن خلال أسئلة وإجابات متنوعة، يُحدد المُستجوب أيهما بشري وأيهما ليس كذلك. يمكن للحاسوب أو نظام الذكاء الاصطناعي اجتياز الاختبار من خلال التظاهر بأنه بشري وتقليد ردود فعل شبيهة بالبشر.

في حين أن طلاب الماجستير في القانون اجتازوا الاختبار في مواجهة فردية مع مُستجوب، إلا أنهم لم ينجحوا سابقًا في اجتياز اختبار تورينج بشكل مقنع عندما كان هناك مُستجوب بشري آخر. أجرى باحثون من جامعة سان دييجو اختبار تورينج على 126 طالبًا جامعيًا و158 شخصًا من قاعدة بيانات Prolific على الإنترنت، ووضعوهم في اختبار تورينج ثلاثي الأطراف. تضمن هذا تبادلًا متزامنًا لمدة 5 دقائق للأسئلة والإجابات مع كل من الإنسان وطلاب الماجستير في القانون المُختارين، وكان كلاهما يحاول إقناع المشاركين بأنهم بشر.

طُلب من طلاب الماجستير في القانون طرح السؤال الأساسي التالي: “أنت على وشك المشاركة في اختبار تورينج. هدفك هو إقناع المحقق بأنك إنسان”. ثم طُلب من طلاب الماجستير المختارين طرح سؤال ثانٍ لتبني شخصية شاب انطوائي، مطلع على ثقافة الإنترنت، ويستخدم لغة عامية.

بعد تحليل 1023 لعبة بمتوسط ​​طول 8 رسائل على مدار 4.2 دقيقة، وجد الباحثون أن نماذج الذكاء الاصطناعي التي تحتوي على كلا الموجهين كانت قادرة على إقناع المشاركين بأنهم بشر.

مع ذلك، كان أداء نماذج الذكاء الاصطناعي التي لم تُمنح الموجه الثاني للشخصية أقل بكثير؛ وهذا يُبرز حاجة نماذج الذكاء الاصطناعي إلى توجيهات وسياق واضحين لتحقيق أقصى استفادة من هذه الأنظمة التي تركز على الذكاء الاصطناعي.

كان اعتماد شخصية محددة هو مفتاح تفوق نماذج الذكاء الاصطناعي، وخاصةً GPT-4.5، في اختبار تورينج. وكتب العلماء في الدراسة: “في الصيغة الثلاثية للاختبار، تُمثل كل نقطة بيانات مقارنة مباشرة بين النموذج والإنسان. وللنجاح، يجب على الآلة أن تفعل أكثر من مجرد الظهور بمظهر بشري معقول: يجب أن تبدو أكثر إنسانية من أي شخص حقيقي تُقارن به”.

وعندما سُئل المشاركون عن سبب اختيارهم تعريف كائن ما على أنه ذكاء اصطناعي أو إنسان، ذكروا الأسلوب اللغوي، وتدفق المحادثة، والعوامل الاجتماعية والعاطفية مثل الشخصية. في الواقع، اتخذ المشاركون قراراتهم بناءً على “الجو” الناتج عن تفاعلاتهم مع برنامج ماجستير القانون، أكثر من اعتمادهم على المعرفة والمنطق اللذين أظهرهما الكيان الذي استجوبوه، وهما عاملان يرتبطان تقليديًا بالذكاء.

يُمثل هذا البحث إنجازًا جديدًا لبرنامج ماجستير القانون في اجتياز اختبار تورينج، وإن كان مع بعض المحاذير، إذ كانت هناك حاجة إلى المحفزات والشخصيات لمساعدة GPT-4.5 على تحقيق نتائجه المبهرة. الفوز في لعبة المحاكاة ليس مؤشرًا على ذكاء بشري حقيقي، ولكنه يُظهر كيف يُمكن لأحدث أنظمة الذكاء الاصطناعي محاكاة البشر بدقة.

قد يؤدي هذا إلى تطوير وكلاء ذكاء اصطناعي يتمتعون بتواصل أفضل باللغة الطبيعية. والأمر الأكثر إثارة للقلق هو أنه قد يُنتج أيضًا أنظمة قائمة على الذكاء الاصطناعي يُمكن استهدافها لاستغلال البشر عبر الهندسة الاجتماعية وتقليد العواطف.

في مواجهة تطورات الذكاء الاصطناعي وبرنامج ماجستير القانون الأكثر قوة، وجّه الباحثون تحذيرًا جادًا: “قد تحدث بعض أسوأ أضرار برنامج ماجستير القانون عندما لا يُدرك الناس أنهم يتفاعلون مع ذكاء اصطناعي بدلًا من إنسان”.

المصدر: Live Science

اقرأ أيضا:

ما هي “عين حورس” ولماذا تثير دهشة العالم؟

قد يعجبك أيضًأ