كشفت منصة TechCrunch عن إطلاق جوجل لإصدار جديد من نموذج الذكاء الاصطناعي المعروف باسم Gemini Pro، والذي يحمل الرقم 3.1 Pro، وهذا الإصدار متاح حاليًا في مرحلة المعاينة وسيتم طرحه بشكل أوسع للمستخدمين والشركات لاحقًا.
يُعتبر هذا النموذج تطورًا مباشرًا للإصدار السابق Gemini 3 الذي تم إطلاقه في نوفمبر الماضي، حيث حقق نتائج مرتفعة في الاختبارات مقارنة بالمنافسين، وتهدف جوجل من خلال هذا الإصدار إلى تقديم نموذج قادر على التعامل مع مهام أكثر تعقيدًا في مجال “العمل المعرفي”، مثل التحليل المتقدم وحل المشكلات التي تتطلب خطوات متعددة.
نتائج قياسية في اختبارات مستقلة
أشارت TechCrunch إلى أن جوجل شاركت نتائج اختبارات مستقلة تُظهر تفوق Gemini 3.1 Pro على الإصدار السابق في عدة معايير، ومن بين هذه المعايير اختبار يُعرف باسم Humanity’s Last Exam، وهو واحد من المقاييس المستخدمة لتقييم قدرة النماذج على حل مشكلات معقدة، واعتبرت جوجل أن هذه النتائج تُظهر أن النموذج أصبح أكثر كفاءة في فهم التعليمات الطويلة وتنفيذ سلاسل من الأوامر المتتابعة، مما يجعله مناسبًا للسيناريوهات التي تعتمد على “وكلاء” أو أنظمة قائمة على مهام متعددة المراحل، وهذه الاختبارات تأتي في سياق تنافس متزايد بين شركات التقنية الكبرى لتقديم نماذج لغوية ضخمة ذات أداء أعلى.
إشادة من منصات قياس أداء النماذج العملية
ذكرت TechCrunch أن بريندان فودي، الرئيس التنفيذي لشركة Mercor المتخصصة في تقييم أداء نماذج الذكاء الاصطناعي في مهام العمل الحقيقية، أعلن أن Gemini 3.1 Pro يتصدر حاليًا لوحة تصنيف APEX-Agents الخاصة بشركته، حيث يُقيّم نظام APEX النماذج بناءً على قدرتها على تنفيذ مهام مهنية عملية، وليس فقط على أساس اختبارات نظرية، ما يعطي صورة أوضح لكيفية أداء النموذج في الاستخدام الفعلي داخل الشركات، وأكد فودي أن نتائج Gemini 3.1 Pro تعكس سرعة تطور النماذج في التعامل مع “العمل المعرفي الحقيقي”، مما يدعم استخدامه في تطبيقات الأعمال التي تتطلب تخطيطًا وتحليلًا واتخاذ قرارات ضمن سياقات معقدة.
منافسة محتدمة في سباق النماذج اللغوية
بينت TechCrunch أن إطلاق Gemini 3.1 Pro يأتي في وقت تشهد فيه سوق الذكاء الاصطناعي سباقًا متسارعًا بين عدة شركات مثل OpenAI وAnthropic وغيرها، حيث تسعى هذه الشركات لإطلاق نماذج قادرة على التفكير المتسلسل والعمل كـ “وكلاء ذكيين”، ولا تقتصر هذه النماذج على إنتاج النصوص أو الإجابة عن الأسئلة فحسب، بل تمتد أيضًا إلى تنفيذ إجراءات على الإنترنت أو داخل أنظمة الشركات بناءً على تعليمات عامة يضعها المستخدم، وجوجل تراهن على نتائج Gemini 3.1 Pro لتعزيز موقعها في هذا السباق، استعدادًا لتكامل النموذج مع منتجات وخدمات مختلفة داخل منظومة الشركة في المستقبل القريب.

