Internet

مبتكرو Sora-powered يشرحون قوة وضعف الفيديو الذي تم إنشاؤه بواسطة الذكاء الاصطناعي

أداة إنشاء الفيديو Sora التي قدمتها OpenAI أثارت دهشة المجتمع الذكاء الاصطناعي في فبراير مع فيديو سلس وواقعي يبدو أنه يتقدم بميل عن المنافسين. ولكن الافتتاح المبرمج بعناية ترك الكثير من التفاصيل - التفاصيل التي قدمها صانع الأفلام الذي حصل على وصول مبكر لإنشاء فيلم قصير باستخدام Sora.

Shy Kids هو فريق إنتاج رقمي مقره في تورونتو الذي اختارته OpenAI كأحد القلائل لإنتاج أفلام قصيرة في الأساس لأغراض ترويجية ل OpenAI، على الرغم من أنهم حصلوا على حرية إبداعية كبيرة في إنشاء «الهواء الرأسي». في مقابلة مع مخرج الرسوم المتحركة بوابة أخبار الرسوم المتحركة fxguide، وصف الفنان باتريك سيديربرغ "استخدام Sora بالفعل" كجزء من عمله.

ربما النقطة الأكثر أهمية بالنسبة لمعظم الناس هي ببساطة هذه: في حين أن تسليط الضوء التالي ل OpenAI على مشاهير الأفلام يجعل القارئ يفترض أنهم تخرجوا من Sora كاملين إلى حد ما، الواقع هو أنها كانت إنتاجات محترفة، تتضمن storyboarding قوي، وتحرير، وتصحيح الألوان، والعمل اللاحق مثل الرسم والتأثيرات البصرية. تمامًا كما يقول Apple "shot on iPhone" ولكن لا يظهر إعداد الاستوديو، والإضاءة المحترفة، وعمل الألوان بعد الحقيقة، يتحدث التعليق على Sora فقط عن ما يسمح للناس بفعله، ليس كيف فعلوا ذلك.

المقابلة مع سيديربرغ مثيرة للاهتمام وغير تقنية بما فيه الكفاية، لذلك إذا كنت مهتمًا على الإطلاق، انتقل إلى fxguide واقرأها. ولكن هنا بعض الأجزاء المثيرة للاهتمام حول استخدام Sora التي تخبرنا أن النموذج، على الرغم من أنه مثير للإعجاب، ربما ليس قفزة عملاقة إلى الأمام كما كنا نعتقد.

التحكم لا يزال الشيء الأكثر رغبة فيه وكذلك الأكثر يصعوبة في هذه النقطة. ... أقرب ما يمكن الحصول عليه كان مجرد تكوين فائق التوصيل في الاقتراحات الخاصة بنا. شرح الزي الخاص بالشخصيات، فضلا عن نوع البالون، كان وسيلتنا حول التناسق لأنه لا توجد ميزة في المكان بعد للتحكم الكامل في التناسق.

بمعنى آخر، يتطلب الأمور التي تكون بسيطة في صناعة الأفلام التقليدية، مثل اختيار لون ملابس الشخصية، حلولًا معقدة وفحوص في نظام إنتاجي، لأن كل لقطة تم إنشاؤها مستقلة من الأخرى. يمكن أن يتغير ذلك بوضوح، ولكنه بالتأكيد أكثر تعبًا في الوقت الحالي.

كما أن مخرجي Sora يجب أن يشاهدوا النواتج الصادرة لعناصر غير مرغوب فيها أيضًا: وصف Cederberg كيف كان يقوم النموذج بتكوين وجه على البالون الذي يحمله الشخصية الرئيسية لرأسه، أو خيطًا معلقًا على الجبهة. كان يجب إزالة هذه العناصر في مرحلة ما بعد، وهي عملية تستغرق وقتًا آخر، إذا لم يتمكنوا من الحصول على الاقتراح لاستبعادها.

لا يمكن حقا توقيت الحركات والتحركات الدقيقة للشخصيات أو الكاميرا: "هناك قليل من السيطرة الزمنية حول حدوث هذه الإجراءات المختلفة في التوليف الفعلي، ولكنها ليست دقيقة ... إنها نوعًا من الضربة في الظلام،" قال سيديربرغ.

على سبيل المثال، يعتبر توقيت الإيماءة مثل الموجة عملية قريبة جدًا ومدفوعة بالاقتراح، على عكس الرسوم المتحركة اليدوية. وقد يكون لقطة مثل التحريك لأعلى على جسم الشخصية تعكس أو لا تعكس ما يريده صانع الفيلم - لذلك قام الفريق في هذه الحالة بإنتاج لقطة مكونة في وضع بورتريه وقاموا بتحريك قص المنجز في مرحلة ما بعد. كانت المقاطع التي تم إنشاؤها كثيرًا في الغالب ببطء لا سبب محدد لذلك.

مثال على لقطة كما خرجت من Sora وكيف انتهت في الفيلم القصير. Image Credits: Shy Kids

في الواقع، استخدام لغة صناعة الأفلام اليومية، مثل "انتقاد اليمين" أو "تتبع اللقطة" كان غير متناسق بشكل عام، وفقًا لما قاله سيديربرغ، مما وجد الفريق مفاجئًا جدًا.

قال: "الباحثون، قبل الاقتراب من الفنانين للتعامل مع الأداة، لم يكونوا يفكرون حقًا كمصوري أفلام".

نتج ذلك أن الفريق قام بمئات الإصدارات، كل منها من 10 إلى 20 ثانية، وانتهى به الأمر إلى استخدام عدد قليل فقط. قدر سيديربرغ نسبة النسبة بنسبة 300:1 - لكن بالطبع من المحتمل أن نكون مصدومين بالنسبة في تصوير عادي.

قام الفريق فعلا بعمل فيديو خلف الكواليس يشرح بعض المشاكل التي واجهوها، إذا كنت فضوليًا. مثل الكثير من المحتوى المتصل بالذكاء الاصطناعي، تكون التعليقات نقدية للغاية على الجهد بأكمله - على الرغم من أنه ليس بشكل مسيء كما رأينا في إعلانات الذكاء الاصطناعي التي تمت محاكاتها مؤخرًا.

العور الأخير يتعلق بحقوق الطبع والنشر: إذا طلبت من Sora أن تمنحك مقطعًا من "حرب النجوم"، فسوف ترفض. وإذا حاولت تجاوزه باستخدام "رجل مكسو بقماش مع سيف ليزر على سفينة فضائية ريترو مستقبلية"، فإنها سترفض أيضًا، حيث أنها بآلية ما تعرف ما تحاول فعله. رفضت أيضًا إجراء لقطة "نوع أرونوفسكي" أو "تكبير هيتشكوك".

من ناحية الأخرى، من المنطقي تمامًا. ولكنه يثير السؤال: إذا كانت Sora تعرف ما هذه، فهل يعني ذلك أن النموذج تم تدريبه على ذلك المحتوى، لتعزيز قدرته على التعرف على أنه ينتهك الحقوق؟ يتجنبOpenAI، الذي يحتفظ ببيانات تدريبه بشكل حصري - حتى درجة السخافة، كما هو الحال مع المدير التنفيذي للتكنولوجيا Mira Murati في مقابلتها مع جوانا ستيرن - سيخبرنا بالتأكيد أبدًا.

أما بالنسبة ل Sora واستخدامه في صناعة الأفلام، فمن الواضح أنها أداة قوية ومفيدة في مكانها، ولكن مكانها ليس "إنشاء أفلام خارجة عن المألوف". بعد. كما قال أحد الأشرار مرة واحدة بشهرة: "هذا يأتي لاحقًا.")

Related Articles

Back to top button Back to top button