OpenAI يتخطى o2 ويظهر لأول مرة نموذج “الاستدلال” الجديد لـ o3 - غاية التعليمية
غاية التعليمية يكتُب.. لقد وصل اليوم الأخير من “12 يومًا من Shipmas” الخاص بـ OpenAI مع الكشف عن o3، وهو نموذج “استدلال” جديد لسلسلة الأفكار تدعي الشركة أنه الأكثر تقدمًا حتى الآن. النموذج ليس متاحًا للاستخدام العام بعد، ولكن يمكن للباحثين في مجال السلامة الاشتراك للمعاينة بدءًا من اليوم.
اخر الاخبار العاجلة عبر غاية التعليمية أخبار محلية ودولية، وكذلك أخبار الر ياضة وخاصة كرة القدم يلا كورة و يلا شوت اليوم.
ويأمل OpenAI وآخرون أن تقطع نماذج الاستدلال شوطًا طويلًا نحو حل المشكلة الضارة المتمثلة في قيام روبوتات الدردشة بإنتاج إجابات خاطئة بشكل متكرر. إن روبوتات الدردشة في الأساس لا “تفكر” مثل البشر، وهناك حاجة إلى تقنيات مختلفة لمحاولة إنشاء أفضل محاكاة لعملية التفكير البشري.
عند طرح سؤال، تتوقف نماذج الاستدلال مؤقتًا وتأخذ في الاعتبار المطالبات ذات الصلة التي يمكن أن تساعد في إنتاج إجابة دقيقة. على سبيل المثال، إذا سألت نموذج o3، “هل يمكن زراعة نبات الهابانيرو في شمال غرب المحيط الهادئ”، فقد يطرح النموذج سلسلة من الأسئلة التي سيبحثها للتوصل إلى نتيجة، مثل “أين ينمو نبات الهابانيرو عادةً”، “” ما هي الظروف المثالية لزراعة نبات الهابنيروس، وما نوع المناخ الذي يتمتع به شمال غرب المحيط الهادئ. يعرف أي شخص استخدم روبوتات الدردشة أنه يتعين عليك أحيانًا مطالبة روبوت الدردشة بمتابعات إضافية حتى يحصل في النهاية على النتيجة الصحيحة. من المفترض أن تقوم نماذج الاستدلال بهذا العمل الإضافي نيابةً عنك.
o3 هو خليفة o1، أول نموذج منطقي لسلسلة الأفكار في OpenAI. قال الممثلون إنهم قرروا تخطي اصطلاح التسمية “o2” “احترامًا” لشركة الاتصالات البريطانية، لكن من المؤكد أنه لا يضر أن يجعل المنتج يبدو أكثر تقدمًا. وتقول الشركة إن النموذج الجديد يأتي مزودًا بالقدرة على ضبط وقت التفكير. يمكن للمستخدمين اختيار وقت التفكير المنخفض أو المتوسط أو العالي؛ كلما زاد الحساب، كان أداء o3 أفضل. تقول شركة OpenAI إنها ستقضي بعض الوقت في “تشكيل فريق أحمر” للنموذج الجديد مع الباحثين لمنعه من إنتاج استجابات قد تكون ضارة (لأنه مرة أخرى، فهو ليس إنسانًا ولا يعرف الصواب من الخطأ).
الاستدلال هو الكلمة الطنانة اليوم في مجال الذكاء الاصطناعي التوليدي، حيث يعتقد المطلعون على الصناعة أنه الحل التالي الضروري لتحسين أداء نماذج اللغات الكبيرة. المزيد من الحوسبة لا تقدم في نهاية المطاف مكاسب أداء مكافئة، لذلك هناك حاجة إلى تقنيات جديدة. كشفت شركة Google DeepMind مؤخرًا عن نموذج تفكير خاص بها يسمى Gemini Deep Research، والذي يمكن أن يستغرق من 5 إلى 10 دقائق لإنشاء تقرير يحلل العديد من المصادر عبر الويب من أجل التوصل إلى نتائجه.
OpenAI واثقة من o3، وتقدم معايير رائعة – تقول أنه في اختبار Codeforceing، الذي يقيس القدرة على البرمجة، حصلت o3 على درجة 2727. بالنسبة للسياق، فإن درجة 2400 ستضع المهندس في النسبة المئوية 99 للمبرمجين. حصل على درجة 96.7% في الاختبار الأمريكي للرياضيات الدعوية لعام 2024، مع فقدان سؤال واحد فقط. سيتعين علينا أن نرى كيف سيصمد النموذج في الاختبارات الواقعية، ولا يزال من غير الجيد بشكل عام الاعتماد كثيرًا على نماذج الذكاء الاصطناعي للقيام بعمل مهم حيث تكون الدقة ضرورية. لكن المتفائلين واثقون من أن مشكلة الدقة قد تم حلها. نأمل ذلك، لأنه في الوقت الحالي، لا تزال نظرة عامة على الذكاء الاصطناعي من Google في البحث موضوعًا للسخرية المتكررة على وسائل التواصل الاجتماعي.
تتنافس الشركات النموذجية للذكاء الاصطناعي، مثل OpenAI وPerplexity، لتصبح Google التالية، حيث تجمع المعرفة العالمية وتساعد المستخدمين على فهم كل شيء. لديهم أيضًا منتجات بحث تهدف إلى تكرار Google بشكل مباشر مع إمكانية الوصول إلى نتائج الويب في الوقت الفعلي.
ومع ذلك، يبدو أن كل هؤلاء اللاعبين يتفوقون على بعضهم البعض مع مرور كل يوم. ويذكرنا هذا الشعور إلى حد ما بأواخر التسعينيات عندما كان هناك عدد لا يحصى من محركات البحث للاختيار من بينها – Google، وYahoo، وAltaVista، وAsk Jeeves، على سبيل المثال لا الحصر، وكلها تقوم بجمع بيانات الإنترنت وتقديمها بمجرد تجربة مستخدم مختلفة. اختفى معظمها بعد ظهور منتج أفضل بكثير من البقية، ألا وهو جوجل.
من الواضح أن OpenAI تتمتع بريادة قوية في الوقت الحالي مع مئات الملايين من المستخدمين النشطين شهريًا وشراكة مع Apple، لكن Google تلقت الكثير من الاستحسان مؤخرًا للتقدم في نماذج Gemini الخاصة بها. تشير تقارير The Verge إلى أن الشركة ستقوم قريبًا بدمج Gemini بشكل أعمق في واجهة البحث الخاصة بها.
كُنا قد تحدثنا في خبر OpenAI يتخطى o2 ويظهر لأول مرة نموذج “الاستدلال” الجديد لـ o3 - غاية التعليمية بأستفاضة، ويمكنك تصفح جميع الأخبار المتعلقة بهذا الشأن عبر موقعنا غاية التعليمية الالكتروني.
0 تعليق