تكنولوجيا

«ميتا» تتحدى «أوبن إيه آي» و«غوغل» بأداة توليد فيديو بالذكاء الاصطناعي

«موفي جن» تنتج مقاطع فيديو قصيرة بناء على صياغة التعليمات النصية

طرحت شركة «ميتا بلاتفورمز»، الشركة الأم لـ«فيسبوك»، أداة ذكاء اصطناعي جديدة يمكنها إنشاء أو تحرير مقاطع فيديو بناء على صياغة تعليمات نصية بسيطة، ما يزيد من حدة المنافسة مع غريمين مثل شركتي «أوبن إيه آي» و«غوغل» في السباق نحو تطوير تكنولوجيا الذكاء الاصطناعي الأكثر تقدماً على مستوى العالم.

يستطيع منتج «ميتا» الجديد، المسمى «موفي جن» (Movie Gen)، إنشاء فيديو جديد يصل طوله إلى 16 ثانية بناء على نص مكتوب. يمكنه أيضاً استخدام صيغ التعليمات في إنشاء مقاطع صوتية أو تعديل فيديو موجود، أو حتى استخدام صورة لإنشاء فيديو حسب الطلب يظهر فيه شخص حقيقي.

باتت أداة «موفي جن» متاحة حالياً لبعض الموظفين الداخليين وعدد محدود من الشركاء الخارجيين، بما فيهم صناع الأفلام، رغم أن شركة التواصل الاجتماعي -التي تملك أيضاً «إنستغرام» و«واتساب» و«ماسنجر»- تعتزم دمج المنتج في تطبيقاتها الحالية خلال السنة المقبلة.

ما يزال المسؤولون التنفيذيون يناقشون الطريقة المثلى لتنفيذ عملية الدمج، لكن الهدف هو تشجيع أداة «موفي جن» المزيد من الأشخاص على إنشاء أو تحرير منشورات بالفيديو، وفق ما ذكره كونور هايز، نائب رئيس «ميتا» المختص بمنتجات الذكاء الاصطناعي التوليدي.

وأوضح: «سيكون من الممتع استخدامه ومفيداً لصناعي المحتوى، وجيداً لزيادة التفاعل بصفة عامة في التطبيقات، لكن لا نملك خطة واضحة حول الشكل النهائي للمنتج في هذه المرحلة».

تعد الشركة الرائدة في مجال وسائل التواصل الإجتماعي واحدة من العديد من شركات التكنولوجيا الكبرى التي تبذل جهوداً كبيرة لتطوير نماذج ذكاء اصطناعي تركز على توليد مقاطع الفيديو، والتي تعد أكثر تعقيداً وتكلفة في الإنتاج بالمقارنة بتلك التي تعتمد على النصوص المولدة بالذكاء الاصطناعي.

وتملك «أوبن إيه آي» المدعومة من «مايكروسوفت» أداة لإنشاء الفيديوهات تسمى «سورا» (Sora)، والتي ظهرت لأول مرة بوقت سابق من العام الجاري، ويمكنها إنشاء مقاطع فيديو تصل مدتها إلى دقيقة واحدة، رغم أن هذه التكنولوجيا غير متاحة حتى الآن للجمهور العادي. وتملك شركة «ديب مايند» (DeepMind)، التابعة لشركة «ألفابت» المالكة لـ«غوغل»، أداة لتوليد الفيديوهات تسمى «فيو» (Veo)، التي أُزيح عنها الستار بوقت سابق من السنة الجارية.

تترقب «ميتا» طرح أداة«”موفي جن» لأسباب عديدة، منها كفاءة التكنولوجيا. في الوقت الحالي، يستغرق توليد فيديو بناء على صياغة تعلميات نصية من 20 إلى 90 دقيقة، ما يعد وقتاً طويلاً للغاية بالنسبة للمستهلكين العاديين، الذين من المرجح أن يستخدموا هذه الأداة على هواتفهم، وفق ما ذكره هايز.

لكن «ميتا» تعمل أيضاً على «حل العديد من المشكلات المهمة فعلاً المتعلقة بالسلامة والمسؤولية»، بما فيها سبل التعامل مع مقاطع الفيديو الشخصية حتى لا يتمكن المستخدمون من إنشاء فيديو غير لائق أو مسيء لشخص آخر دون موافقته. أوضح هايز أن «هذه ستكون على الأرجح المشكلة الأبرز التي ينبغي لنا حلها قبل أن نطرح إمكانية تصميم فيديوهات حسب الطلب للجمهور على نطاق واسع».

استخدمت هذه التكنولوجيا في السابق لإنشاء مقاطع فيديو خادعة ومضللة تُعرف بـ«التزييف العميق» لشخصيات مشهورة، بما فيها الرئيس الأميركي جو بايدن والمغنية تايلور سويفت، لكن المسؤولين في «ميتا» أشاروا إلى أنهم يعملون على طرق لوضع “علامات مائية” على هذ المحتوى المصنوع حتى يتمكن الأشخاص من معرفة أنها مولدة بواسطة الذكاء الاصطناعي.

جعلت «ميتا» التقدم في مجال الذكاء الاصطناعي أولوية قصوى للشركة بأكملها، وتحدث الرئيس التنفيذي مارك زوكربيرغ مراراً عن الذكاء الاصطناعي باعتباره محركاً لنمو المستخدمين والإيرادات.

على المدى القصير، أرجع زوكربيرغ الفضل إلى الذكاء الاصطناعي في تحسين خوارزميات المحتوى الخاصة بالشركة من خلال عرض منشورات وإعلانات أكثر صلة للمستخدمين. في نهاية المطاف، أعرب زوكربيرغ عن اعتقاده بأن الذكاء الاصطناعي سيسهم بدور أكبر في تشغيل تطبيقات “ميتا” وأجهزة المستقبل القابلة للارتداء التي تعمل الشركة على إنتاجها، مثل النظارات الذكية.

أشار زوكربيرغ الشهر الماضي إلى أن «ميتا أيه آي» -روبوت الدردشة الخاص بالشركة- يحظى بـ500 مليون مستخدم شهرياً، كما أنه متاح بوصفه مساعداً صوتياً في زوج من النظارات الذكية التي طورتها «ميتا» وتحمل علامة «راي-بان» (Ray-Ban) التجارية. ما زالت النظارات الأكثر تطوراً في مجال تكنولوجيا الواقع المعزز -تسمى أوريون (Orion)- في مرحلة النموذج الأولي وتحتوي على عدة ميزات تعتمد على تكنولوجيات الذكاء الاصطناعي.

زر الذهاب إلى الأعلى