كشفت منصة TechCrunch عن أداة جديدة من قسم DeepMind في جوجل تُعرف باسم Project Genie، وهي أداة ذكاء اصطناعي تجريبية قادرة على إنشاء عوالم ألعاب تفاعلية بناءً على وصف نصي أو صورة واحدة داخل المتصفح.

الأداة متاحة حاليًا لمشتركي خدمة Google AI Ultra في الولايات المتحدة، وتعتمد على نموذج متطور يسمى Genie 3، بالإضافة إلى نموذج لتوليد الصور يُعرف بـ Nano Banana Pro، ونموذج Gemini الذي ينسق بين هذه المكونات.

إنشاء عالم من جملة واحدة

تعمل Project Genie من خلال طلب المستخدم لوصف شكل العالم الذي يرغب في استكشافه، مثل نوع المكان وكيفية الحركة داخله، سواء كان ذلك بالمشي أو القيادة أو الطيران، كما يُطلب منه تحديد شكل الشخصية، هل هي إنسان أو حيوان أو شكل بسيط. بعد ذلك، يقوم النظام بتوليد صورة أولية تُسمى World Sketching، يمكن للمستخدم تعديلها حتى تصل إلى الشكل المطلوب، ثم يحوّلها إلى عالم تفاعلي يمكن التحرك فيه لمدة تصل إلى حوالي 60 ثانية لكل تجربة.

عوالم تفاعلية وإمكانية إعادة المزج

لا تقتصر إمكانيات Project Genie على إنشاء عوالم جديدة فحسب، بل تتيح أيضًا ميزة Remix Worlds، التي تسمح للمستخدم بإعادة استخدام عوالم جاهزة وتعديلها أو البناء عليها بناءً على الأوامر النصية التي أنشأها. يمكن للمستخدم أيضًا استيراد صور حقيقية، مثل صورة مكتب أو غرفة، وتحويل العناصر الموجودة فيها إلى عالم افتراضي يتحرك فيه كائن أو شخصية، مع محاولة جعل الأجسام تتفاعل أثناء مرور الشخصية بجوارها، ولكن دقة التفاعل لا تزال قيد التطوير.

قيود تقنية وإجراءات أمان صارمة

وضعت جوجل قيودًا واضحة على استخدام Project Genie، حيث يحذر النظام من أن العوالم المولدة قد لا تتوافق دائمًا مع القواعد الفيزيائية الواقعية، وقد تتحرك الشخصيات أحيانًا عبر الجدران أو الأجسام الصلبة بدلاً من الالتفاف حولها. كما تتضمن الأداة حواجز أمان تمنع إنشاء عوالم تحتوي على محتوى غير مناسب مثل العري أو العنف أو عوالم تجسد شخصيات مملوكة لجهات أخرى مثل ديزني، وذلك بعد النزاعات السابقة حول حقوق الملكية الفكرية في نماذج الذكاء الاصطناعي.