-

استكشاف نموذج Veo 2 لتوليد الفيديوهات

(اخر تعديل 2025-04-27 16:04:47 )

في الأسبوع الماضي، بدأت شركة جوجل بإطلاق نموذج Veo 2 لتوليد الفيديوهات لمشتركي Gemini Advanced. لقد قضيت وقتاً ممتعاً في استكشاف هذا النموذج الجديد، لدرجة أنني للأسف قد تجاوزت الحد الشهري للجولات المسموح بها لتوليد الفيديوهات.
أنت محبوبي 2 الحلقة 8

قبل التوسع في استخدام Veo 2، كانت جوجل قد سلطت الضوء على مقاطع الفيديو التي تم إنشاؤها بواسطة النموذج، والتي كانت صعبة التمييز عن الفيديوهات التي صنعها الإنسان، سواء كانت تحاكي لقطات حقيقية أو رسوم متحركة لطيفة. بينما لم تكن النتائج التي رأيتها خلال استخدامي لـ Veo 2 مثيرة للإعجاب تماماً، إلا أنني أستطيع القول إنها كانت أقرب مما توقعت، وحتى الأسوأ منها كانت لا تزال مثيرة للاهتمام. إليكم خمسة من أولى النتائج المفضلة لدي من Veo 2.

1. حفلة أسماك قرش في الغابة

في هذا الفيديو، قمت بتجربة تقليد قديم في الطلب من الذكاء الاصطناعي أن ينشئ مشهداً غريباً وغير منطقي. طلبت من Veo 2 إنشاء فيديو لأسماك قرش بشرية تشعل ناراً في الغابة، وتحمل أكواباً حمراء. وقد حصلت على ما طلبت، ولكنني طلبت أيضاً أن تتضمن "فانات"، على افتراض أن النموذج سيفهم أنني أعني نوع الفان الذي يستخدمه الناس في التخييم. بدلاً من ذلك، حصلت على أسماك قرش ترتدي أحذية فانت معروفة. ليس ما كنت أبحث عنه بالضبط، لكن بالتأكيد كان الأمر مضحكاً.

تبدو اللقطة التي تستمر ثماني ثوانٍ والتي تظهر أسماك القرش تتراقص حول النار واقعية من النظرة الأولى، حيث تشتعل النار بشكل واقعي، والخلفية ضبابية بشكل مقنع، وجلد أسماك القرش يظهر بعض التفاصيل الواقعية. ومع ذلك، فإن التفاصيل الدقيقة ليست بهذا الوضوح: إذ يبدو أن كل سمكة قرش تمتلك زعنفة عادية ويد بشرية واحدة. كما أن الأكواب في الخلفية كانت تطفو بالقرب من أيديها بدلاً من أن تكون ممسكة بها. ومع ذلك، كانت هذه محاولة جديرة بالاهتمام لشيء عديم الفائدة.

2. جمجمة ذهبية مطرزة

لاستكشاف كيفية تعامل Veo 2 مع القوام المعقد، طلبت منه إنشاء جمجمة ذهبية بتفاصيل مطرزة بدقة، تدور تحت ضوء ساطع. كانت النتيجة تبدو غير مكتملة، حيث كانت الجمجمة تدور جزئياً، ثم تتوقف، ثم تستمر، ولكن كل من تشريح الجمجمة وطريقة تفاعل الضوء مع القوام والتفاصيل كانت مقنعة.

3. مذيعو الأخبار المعتمدين على الذكاء الاصطناعي

تخيلاً لكيفية إمكانية استخدام توليد الفيديو لخداع الناس، طلبت من Veo 2 محاكاة بث إخباري، مع مذيعين يجلسون على مكتب ويتحدثون إلى الكاميرا. كانت النتائج في الغالب مقنعة — حيث أن أحد المذيعين يتحدث بينما يومئ الآخر برأسه. حتى أن لديهم انعكاسات واقعية على سطح المكتب.

لكن Veo 2 لم يكن دقيقاً في النص في هذه الحالة: كان من المفترض أن تظهر الترجمة في الأسفل "توليد الفيديو بالذكاء الاصطناعي هنا. ما الهدف منه؟" كانت قريبة، لكنها لم تكن دقيقة تماماً. كانت بعض التفاصيل الصغيرة في اللقطات غير صحيحة، مثل ظهور واختفاء قلم أحد المذيعين، وارتداء الآخر لميكروفونين. ومع ذلك، كانت الرسومات خلف المذيعين تبدو مناسبة تماماً لفقرة إخبارية عن فيديو الذكاء الاصطناعي، حيث تحتوي على شريط فيلم مغطى بأصفار وواحدات.

4. أسطورة زيلدا — نوعاً ما؟

كنت فضولياً لمعرفة ما إذا كان Veo 2 قد تم تدريبه على لقطات من ألعاب الفيديو، لذلك طلبت منه إنشاء مشاهد من بعض الألعاب المحددة. في هذه الحالة، وصفت اللحظات الافتتاحية من لعبة The Legend of Zelda: Breath of the Wild، حيث يخرج Link من كهف لينظر إلى المنظر من جرف.

لم يتمكن Veo 2 من تحقيق ذلك بدقة، لكنه بالتأكيد تم تدريبه على لقطات من اللعبة. شخصية شبيهة بـ Link تخرج من كهف وتذهب إلى جرف، مع كتلة من العناصر على ظهرها تبدو بشكل غامض كسيف ودرع إذا نظرت بعناية. بشكل مثير للاهتمام، كان واجهة المستخدم الخاصة باللعبة تقريباً سليمة — حيث كانت العناصر في الأماكن الصحيحة، وكانت الخريطة في الزاوية تدور بشكل واقعي مع حركة الكاميرا.

5. لعبة سايبربانك 2077

طلبت من Veo 2 الحصول على لقطات من بعض الألعاب بعد Breath of the Wild، لكن الطلب البسيط "لعبة سايبربانك 2077" أعطى ما بدا أنه أدق نتيجة. كانت الشارع الممطر في المدينة، واجهة المستخدم، والطائرات الصغيرة — كل ذلك يبدو كأنه من سايبربانك. حتى أن هناك لافتة إعلانات تروّج لزرع إلكتروني.

ومع ذلك، كانت التفاصيل الدقيقة غير دقيقة؛ النصوص والرموز كانت مشوشة وغير واضحة، ويبدو أن Veo 2 أضاف حركة غير منطقية للشخصية رغم عدم تحركها عبر المشهد. ومع ذلك، يعرف Veo 2 كيف يبدو سايبربانك 2077، ولا يتردد في إعادة إنشائه.

توليد فيديو ذكاء اصطناعي مناسب للجميع

شعرت أن الأسبوع الأول لي مع Veo 2 في Gemini كان شبيهاً بتجربتي المبكرة مع تطبيقات توليد الصور بالذكاء الاصطناعي. إن جاذبية إدخال عبارة قصيرة للحصول على فيديو قصير في دقيقة أو دقيقتين تعني أنه حتى عندما تكون النتائج دون المستوى، فإنها لا تزال مثيرة للاهتمام. إنه جديد، وغريب، وممتع.

ومع ذلك، لست متأكداً مما يفترض أن يفعله المستخدمون العاديون مع Veo 2 بخلاف التسلية. بالنظر إلى مدى استهلاك توليد الفيديو للموارد، فإن تقديم Veo 2 كجزء من اشتراك شهري بقيمة 20 دولاراً لا يبدو مستداماً تماماً لجوجل. وما هو أكثر، يبدو أن Gemini قد تقدم في النهاية ميزة توليد فيديو "مجانية" لا تكلف أي أموال على الإطلاق. لقد تم قطع وصولي إلى Gemini Advanced بعد أن قمت بإنشاء حوالي 50 مقطع فيديو، ومن المحتمل أن تكون النسخة المجانية من هذه الميزة محدودة أكثر.

مهما كانت طموحات جوجل طويلة الأمد في توليد الفيديو، فإن Veo 2 يتم طرحه بشكل واسع لمشتركي Gemini Advanced حالياً في كل من التطبيق المحمول وواجهة الويب لـ Gemini.