غاية التعليمية

دراسة حديثة.. نماذج الذكاء الاصطناعي المتطورة غير قادرة على حل معظم المشكلات البرمجية - غاية التعليمية

دراسة حديثة.. نماذج الذكاء الاصطناعي المتطورة غير قادرة على حل معظم المشكلات البرمجية - غاية التعليمية

غاية التعليمية يكتُب.. كشف باحثون في شركة OpenAI أنه حتى نماذج الذكاء الاصطناعي الأكثر تطورًا ما تزال غير قادرة على التفوق على المبرمجين البشر، مع أن الرئيس التنفيذي سام ألتمان صرّح سابقًا بأن هذه النماذج قد تتفوق على مهندسي البرمجيات المبتدئين بحلول نهاية العام الحالي.

اخر الاخبار العاجلة عبر غاية التعليمية أخبار محلية ودولية، وكذلك أخبار الر ياضة وخاصة كرة القدم يلا كورة و يلا شوت اليوم.

اختبار كفاءة نماذج الذكاء الاصطناعي في البرمجة

في دراسة حديثة أجراها باحثون في شركة OpenAI، أظهرت النتائج أن النماذج المتقدمة من الذكاء الاصطناعي ما تزال غير قادرة على حل الغالبية العظمى من المهام البرمجية.

واعتمد الباحثون في تقييمهم على معيار جديد يُدعى SWE-Lancer، طُوّر باستخدام أكثر من 1400 مهمة برمجية مستمدة من منصة العمل الحر Upwork.

واختبر الباحثون ثلاثة نماذج متطورة من الذكاء الاصطناعي، هي:

  • نموذج o1 الخاص بشركة OpenAI.
  • نموذج GPT-4o الرائد من OpenAI.
  • نموذج Claude 3.5 Sonnet من شركة Anthropic.

وركز الاختبار في نوعين من المهام البرمجية، هما:

  • إصلاح الأخطاء البرمجية.
  • اتخاذ قرارات على مستوى عالٍ لإدارة المشاريع البرمجية.

ولضمان دقة التقييم، لم يُسمح للنماذج بالوصول إلى الإنترنت؛ مما منعها من الوصول إلى حلول جاهزة أو الاعتماد على أمثلة سابقة منشورة على الإنترنت.

النتائج: 

واجهت نماذج الذكاء الاصطناعي صعوبة في التعامل مع المهام المطلوبة منها، ولم تتمكن من إصلاح سوى الأخطاء البرمجية البسيطة، وعجزت عن اكتشاف الأخطاء في المشاريع البرمجية الكبيرة أو تحليل أسبابها الجذرية.

ومع أن النماذج أظهرت سرعة أكبر من البشر في تنفيذ المهام، فإنها أخفقت في فهم الأخطاء، مما أدى إلى حلول غير دقيقة أو غير شاملة.

تفوق نسبي لنموذج Claude 3.5 Sonnet

بحسب الدراسة، أظهر نموذج Claude 3.5 Sonnet أداءً أفضل من نماذج OpenAI الأخرى، لكن معظم إجاباته كانت غير صحيحة. وأكد الباحثون أن أي نموذج ذكاء اصطناعي يحتاج إلى مستوى أعلى من الدقة والموثوقية قبل أن يُعتمد عليه في المهام البرمجية الحقيقية.

الخلاصة: الذكاء الاصطناعي لم يصل بَعد إلى مستوى مهندسي البرمجيات

تُشير هذه الدراسة إلى أن نماذج الذكاء الاصطناعي يمكنها أداء المهام البرمجية البسيطة بسرعة، لكنها ما تزال غير قادرة على التعامل مع المشاريع البرمجية المعقدة بكفاءة مماثلة لكفاءة المبرمجين البشر.

ومع أن مجال الذكاء الاصطناعي يتطور بسرعة، فإنه ما يزال غير قادر على العمل مثل المبرمجين البشريين. ومع ذلك، لم يمنع هذا بعض الشركات من التوجه نحو تقليص عدد المبرمجين البشريين لصالح نماذج الذكاء الاصطناعي، حتى مع عدم تفوقها في هذه المهام بَعد.

كُنا قد تحدثنا في خبر دراسة حديثة.. نماذج الذكاء الاصطناعي المتطورة غير قادرة على حل معظم المشكلات البرمجية - غاية التعليمية بأستفاضة، ويمكنك تصفح جميع الأخبار المتعلقة بهذا الشأن عبر موقعنا غاية التعليمية الالكتروني.

أخبار متعلقة :