بغداد- العراق اليوم: أعلنت "مايكروسوفت" عن نموذج جديد للذكاء الاصطناعي يمكنه توليد مقاطع فيديو واقعية للغاية لوجوه بشرية تتحدث، يحمل اسم "فازا 1" (vasa 1).
وتقول الشركة إن مقاطع الفيديو المولدة تحتوي حركات الشفاه المتزامنة لتتناسب مع الصوت، بالإضافة إلى تعبيرات الوجه وحركة الرأس لجعلها تبدو طبيعية.
ولا تنوي "مايكروسوفت" إطلاق منتج أو واجهة برمجة تطبيقات تستفيد من نموذج "فازا 1" نظراً إلى الخطر الواضح المتمثل في توليد التزييف العميق من هذه التكنولوجيا.
وفصلت "مايكروسوفت" طريقة عمل نموذج الذكاء الاصطناعي، وسلطت الضوء على قدراته. وتدعي الشركة أن النموذج قادر على توليد مقاطع فيديو بدقة قدرها 512×512 بكسل بمعدل يصل إلى 40 إطاراً في الثانية.
ويدعم نموذج الذكاء الاصطناعي توليد الفيديو عبر الإنترنت مع زمن تأخر لا يكاد يذكر. ويقدم "فازا 1" ما يصل إلى دقيقة واحدة من مقاطع الفيديو بجودة عالية من خلال صورة ثابتة واحدة.
وسلطت الشركة الضوء على قدرته على توليد حركات الشفاه المتوافقة مع الملف الصوتي وتعبيرات الوجه التي تتماشى معه.
ويوفر نموذج توليد الفيديو بتقنية الذكاء الاصطناعي تحكماً دقيقاً للمستخدم في جوانب مختلفة من الفيديو، مثل الاتجاه الرئيسي لنظرة العين ومسافة الرأس والمزيد.
وتساعد هذه العناصر في التحكم في وضعية الرأس الثلاثية الأبعاد وديناميكيات الوجه، ما يساعد في تعديل الإخراج وفقاً لتوجيهات المستخدم.
كما أن نموذج الذكاء الاصطناعي قادر أيضاً على توليد مقاطع فيديو باستخدام الصور الفنية والصوت الغنائي والكلام غير الإنكليزي.
*
اضافة التعليق