بايت دانس تطلق OmniHuman-1 ثورة جديدة في الذكاء الاصطناعي للفيديو
أعلنت شركة بايت دانس، المالكة لمنصة تيك توك، عن تطوير نموذج ذكاء اصطناعي جديد يحمل اسم OmniHuman-1، والذي يُحدث نقلة نوعية في عالم إنشاء مقاطع الفيديو المولدة بالذكاء الاصطناعي تدّعي الشركة أن هذا النموذج قادر على تحسين جودة المقاطع بمعدل يصل إلى عشرة أضعاف مقارنةً بالنماذج المتوفرة حاليًا، ما يجعله من أكثر الابتكارات تطورًا في هذا المجال.
يختلف هذا النموذج عن الأساليب التقليدية التي تعتمد على الأوامر النصية، إذ يستند OmniHuman-1 إلى الصور كمدخلات أساسية، ما يتيح له معالجة الصور الشخصية وحتى الرسوم الكرتونية، ومن ثم تحويلها إلى مقاطع فيديو متحركة ذات طابع واقعي كما يمكن للمستخدمين دمج مقاطع صوتية أو مرئية إضافية ليبدو المحتوى وكأنه تم تصويره بكاميرا حقيقية.
يمتاز النموذج بمستوى مذهل من الواقعية، الأمر الذي قد يجعل من الصعب التمييز بين المقاطع التي يتم إنشاؤها عبر الذكاء الاصطناعي والمحتوى المصور فعليًا وترى بايت دانس أن هذه التقنية قد تمثل قفزة كبيرة نحو تحقيق محاكاة بصرية أكثر إقناعًا، متجاوزةً بذلك ما يُعرف بتأثير “الوادي الغريب”، الذي يجعل الشخصيات الرقمية تبدو غير طبيعية في بعض الأحيان.
لكن على الرغم من هذه التطورات الواعدة، يثير OmniHuman-1 بعض المخاوف بشأن إمكانية استغلاله في عمليات التزييف والخداع الرقمي ولهذا، تبرز الحاجة إلى تطوير أدوات فعالة لكشف المحتوى المُنشأ بالذكاء الاصطناعي وتمييزه بوضوح، حتى لا يُستخدم في نشر الأخبار الزائفة أو التلاعب بالحقائق وتظل مسؤولية الشركات المطورة إيجاد حلول تضمن الاستخدام الأخلاقي لهذه التقنيات المتقدمة.
يأتي إطلاق OmniHuman-1 في وقت تتسارع فيه المنافسة بين الشركات الكبرى في مجال الذكاء الاصطناعي، إذ تخطط بايت دانس لاستثمارات ضخمة تصل إلى 12 مليار دولار في هذا القطاع بحلول عام 2025، وفقًا لما نشرته وكالة رويترز في المقابل، تواصل OpenAI تطوير نموذجها Sora، بينما تعمل جوجل على نموذج Veo، وكلاهما يهدف إلى دفع حدود إمكانيات إنشاء الفيديو بالذكاء الاصطناعي إلى مستويات غير مسبوقة.