A+ A-

(سورا) .. ثورة الذكاء الاصطناعي لتحويل الأفكار إلى فيديو

(سورا) .. ثورة الذكاء الاصطناعي لتحويل الأفكار إلى فيديو

من الهيثم صالح

(تقرير) الكويت - 13 - 3 (كونا) -- أخيرا أزاحت شركة التكنولوجيا الأمريكية (أوبن أيه آي) الستار عن نموذج الذكاء الاصطناعي الجديد (سورا) الذي يحول الأفكار التي يتم التعبير عنها من خلال صور أو نصوص مكتوبة إلى مقاطع فيديو واقعية لتدشن بذلك عصرا جديدا في صناعة الفيديو والإعلام الأوسع.
وفور إطلاقه في الأيام الماضية أحدث نموذج سورا (السماء باللغة اليابانية) ضجة هائلة في أوساط صناعة الإعلام والأفلام وعلى مواقع التواصل الاجتماعي في الولايات المتحدة إلى حد جعل صحيفة (واشنطن بوست) تقول إنه سيتيح قريبا "إنتاج أجود مقاطع الفيديو من الصفر".
ويظهر تحليل الفيديو المعمق الذي أجرته وكالة الأنباء الكويتية (كونا) للمقاطع التي بثتها (أوبن أيه آي) قدرات مذهلة أثبتها النموذج الثوري الجديد في إنتاج مقاطع الفيديو الواقعية لمدة دقيقة واحدة باحترافية وبدرجة وضوح كاملة FHD (1080 بكسل) بالاعتماد فقط على إدخال أوصاف نصية.
وتقول الشركة المدعومة من عملاق التكنولوجيا الأمريكية (مايكروسوفت) إن الابتكار الجديد يمكنه أيضا توليد مقاطع الفيديو المستوحاة من الصور الثابتة وإضافة محتويات بصرية للفيديو (توسيع الفيديو).
وتعهدت (أوبن أيه آي) في بيان لها بالإبقاء على (سورا) قيد الاختبار حاليا بالنسبة للأضرار والمخاطر والمخاوف التي قد يثيرها هذا النموذج لكنها أتاحته تجريبيا لعدد محدود من الفنانين وصناع الأفلام للاستفادة من تعليقاتهم لتطويره ليكون أكثر فائدة للمحترفين والمبدعين.
ودعا رئيس الشركة سام أولتمان المستخدمين إلى تقديم مقترحات لإنشاء مقاطع الفيديو وقال في البيان ذاته "نشارككم التقدم الذي أحرزناه في أبحاثنا مبكرا لبدء العمل مع أناس خارج (أوبن أيه آي) ليقدموا تعليقاتهم ولكي نعطي الجمهور فكرة عن قدرات الذكاء الاصطناعي التي تلوح في الأفق".
فبعد ابتكارها عددا من أقوى أدوات توليد النصوص والصور ChatGPT- GPT-4- Dall- E يأتي نموذج الفيديو (سورا SORA) كأحدث القفزات الاستثنائية التي تحققها الجهود الجريئة بقيادة شركة (أوبن أيه آي) التي أعطت الذكاء الاصطناعي قوة دفع هائلة.
وعلى الرغم من أن إنتاج الفيديو بالذكاء الاصطناعي موجود تقريبا منذ العام الماضي لدى عمالقة التكنولوجيا الأمريكية مثل (ميتا) و(غوغل) فإن النتائج التي قدمها (سورا) سواء من حيث جودة المقاطع ودقتها وطولها ووضوحها لا تقارن إطلاقا بغيرها كما أنها تأتي خلال دقيقة واحدة فقط من طلب المستخدم ما يجعل (سورا) نقلة مذهلة في صناعة الفيديو.
فقد أنتج (سورا) مقطعا بالاعتماد على إدخال النص التالي بالإنجليزية "فتاة أنيقة تسير في شارع بطوكيو يعج بالأضواء المتلألئة والدافئة واللافتات المتحركة.. الفتاة الجميلة ترتدي فستانا أحمر طويلا وفوقه جاكيت جلد أسود وترتدي حذاء أسود.. الفتاة تحمل محفظة سوداء وترتدي نظارة شمسية وتضع أحمر الشفاه وتمشي عرضيا وبثقة في الشارع المبلل العاكس للأضواء المتلألئة.. كثير من الناس يسيرون في هذا الشارع".
ومن أعقد الأوصاف التي استجاب لها النموذج الجديد توليد فيديو تاريخي من خياله لولاية كاليفورنيا الأمريكية عام 1848 أثناء (حمى الذهب) وهي من الأحداث المفصلية في تاريخ الولايات المتحدة كما أنشأ فيديو لسيدة مسنة تنفخ شموع عيد الميلاد وعلماء آثار يكتشفون كرسيا بلاستيكيا في قلب الصحراء وينظفونه بعناية.
وفي أوصاف أكثر تحديا أنتج (سورا) مقطع فيديو بناء على هذا النص بالإنجليزية "طوكيو الجميلة مغطاة بالثلوج وتنبض بالحياة.. الكاميرا تتحرك عبر شارع المدينة الصاخب لتتبع أولئك الذين يستمتعون بالطقس الثلجي الجميل ويتسوقون من الأكشاك القريبة.. زهور الساكورا الرائعة تتطاير في الهواء مع ندفات الثلج".
يظهر الفيديو المرفق بهذا التقرير كيف أن (سورا) بناء على طلب المستخدم قد استطاع ليس فقط تخيل مشاهد شديدة التعقيد واستيعاب التفاصيل الدقيقة للموضوعات والخلفيات بل أدرك أيضا كيفية وجود هذه المشاهد في العالم الحقيقي كما استوعب حركة الكاميرا بدقة وبأشكالها المختلفة.
ومع ذلك يظهر من تحليل المقاطع الذي أجرته (كونا) بعض الصعوبات قد يجدها هذا النموذج التجريبي في محاكاة بعض المشاهد المعقدة وربما يخلط في اتباع مسار معين للكاميرا لكن لنتذكر أننا قبل عام واحد فقط كنا نتحدث عن ابتكارات روبوتات توليد النصوص والصور واليوم لننظر أين نقف؟ ولنتخيل أين سنكون بعد عام؟ فـ(سورا) هو أحدث الاختراقات المتلاحقة التي تحققها (تكنولوجيا التعلم العميق) العمود الفقري للذكاء الاصطناعي التوليدي وهي عبارة عن خوارزميات تحاكي الخلايا العصبية تخضع من خلالها الآلة لتدريب شديد على كميات هائلة من البيانات عبر هندسة الشبكات العصبية لجعل الآلة تكسر أغلال الذكاء الاصطناعي المحدود وتتمكن ليس فقط من التعلم الذاتي بل أيضا التفكير والتخيل والاستنباط والتحليل والرؤية والاستماع للأصوات والتعرف عليها واتخاذ ردود الفعل عليها.
لكن هذه التطورات المتسارعة تثير تساؤلات عميقة عن البصمة التي يوشك الذكاء الاصطناعي أن يتركها في صناعة الإعلام خصوصا أن النموذج الجديد يتمتع بفهم أعمق للغة بما يمكنه من تفسير الأوامر بدقة وإنشاء شخصيات مقنعة تعبر عن المشاعر النابضة بالحياة.

وتوقعت أستاذة صحافة الملتيميديا بالجامعة الأمريكية في القاهرة رحاب إسماعيل في تصريح لـ(كونا) أن يشق نموذج (سورا) طريقه سريعا إلى الإعلام الرقمي وأن يستبدل بالبرامج والطرق المعتمدة حاليا لإنتاج الفيديو خصوصا في صناعة الوثائقيات والفيديو الإخباري اليومي (الفيديوغرافيك).
وأضافت إسماعيل أنه "في غرف الأخبار يبحث الصحفيون دائما عن طرق مبتكرة لصناعة الفيديو وجذب الجمهور وبدأوا بالفعل في إنتاج الصور بالذكاء الاصطناعي والآن لدينا توليد الفيديو.. المستقبل مفتوح على جميع الاحتمالات".
ورأت "أننا نحتاج كثيرا من التجربة كي نتعلم كيفية اتقان المهارة الجديدة وتوظيفها في غرف الأخبار فخلال فترة بسيطة ستكون هذه التكنولوجيا هي الأمر الطبيعي حتى للمستخدم العادي".
وتابعت أن "العالم يتغير بسرعة مذهلة وهذا يضع مسؤولية إضافية على الصحفيين لتطوير مهاراتهم سريعا من أجل استيعاب هذا التغير" داعية الصحفيين والمؤسسات الإعلامية للتفكير في المستقبل بسرعة "وبناء محتوى فريد لا يمكن استنساخه بسهولة".
وأشارت في هذا السياق إلى أن مشاعر القلق باتت تخيم على المؤسسات الإعلامية مع هذا التوسع التكنولوجي الفائق لأسباب تتعلق بـ"قضايا الملكية الفكرية" وهي واحدة من أدق التساؤلات الملحة التي يطرحها مستقبل انتشار الذكاء الاصطناعي.
ونبهت إسماعيل إلى أنه لا توجد حتى الآن قوانين حقيقية تنظم حقوق الملكية الفكرية تجاه المحتوى المنتج بالذكاء الاصطناعي "فتدريب الذكاء الاصطناعي على أعمال الآخرين من دون تعويضهم مشكلة كبيرة تحتاج إلى أبحاث معمقة من المؤسسات الأكاديمية والإعلامية".
لكن هذه ليست التساؤلات الوحيدة التي يثيرها الاقتحام السريع لتكنولوجيا الذكاء الاصطناعي صناعة الإعلام فهذه القدرات المذهلة تخفي أيضا مخاوف عميقة من انتشار المعلومات الزائفة والمضللة (misinformation and disinformation) ليجد الناس أنفسهم ذات يوم عاجزين عن معرفة ما يمكن أن يصدقوه.
ولم يخف أستاذ تكنولوجيا الإعلام في الجامعة الأمريكية بالقاهرة أحمد عصمت في تصريح لـ(كونا) خشيته من أن يساهم نموذج (سورا) في انتشار (التزييف العميق Deepfake) وسط أجواء انتخابية تخيم على عدة دول كبرى بالعالم ووجود بؤر للصراعات في أنحاء أخرى رئيسية.
ونبه عصمت - وهو استشاري في صحافة التحقق من البيانات الرقمية - إلى أن هذه الظروف تعد بيئات خصبة لإنتاج المحتوى المزيف لاسيما مع قدرة نموذج (سورا) المذهلة على إنتاج مقاطع فيديو واقعية شديدة الوضوح بمدة كاملة خلافا لباقي نماذج الذكاء الاصطناعي فـ"قاعدة البيانات هنا أعلى والنموذج اللغوي أكبر والتقنية أكثر تقدما".
ودق عصمت جرس الإنذار أمام المؤسسات الإعلامية من أن طوفان تكنولوجيا الذكاء الاصطناعي لا يقابل حاليا باستثمارات مماثلة في أدوات التحقق من المحتوى الرقمي لمساعدة الصحفيين على مواكبة هذه القفزات المذهلة المستمرة منذ العام الماضي.
وتابع أنه "في عمليات التحقق لا نزال نستخدم تكنولوجيا تخليق المحتوى نفسها في الكشف عنه لذا لابد للصحفيين من دراسة هذا النموذج بسرعة لنعرف إلى أين سنمضي".
إلى ذلك يؤكد الخبراء أن البشرية لم تر حتى الآن سوى غيض من فيض من تكنولوجيا الذكاء الاصطناعي التي تتطور بسرعة مذهلة يعجز عن فهمها واستيعابها حتى المشتغلون بالإعلام الرقمي.
وقال البروفيسور تيد أندروود أستاذ تكنولوجيا المعلومات في جامعة إلينوي لصحيفة واشنطن بوست تعليقا على إطلاق نموذج (سورا): "لم أتوقع هذا المستوى من إنتاج الفيديو المستمر والمتماسك قبل عامين أو ثلاثة أعوام مقبلة على الأقل".
في موازاة ذلك تتوقع دراسة حديثة أعدها عشرات الباحثين من كبريات مؤسسات الإعلام والتكنولوجيا العالمية في سلسلة ورش بحثية استضافها المعهد الملكي للشؤون الدولية في لندن (تشاثام هاوس) أن يهيمن الذكاء الاصطناعي على انتاج الأخبار والمحتوى الرقمي بحلول عام 2026.
ومع ذلك لا تنصح الدراسة بالمواجهة مع قوة الذكاء الاصطناعي بل تدعو إلى تسخيرها في جعل عمل الإعلام أكثر كفاءة في مناخ اقتصادي عالمي يزداد قتامة.
فعلى إثر الصراعات العالمية والإقليمية وضغوط تغير المناخ والانكماش الاقتصادي تسود توقعات باستمرار تباطؤ الإعلانات والغاء ملفات الارتباط (كوكز) بسبب قوانين تنظيم الانترنت وتقليل الإحالة من مواقع التواصل مما سيزيد الضغوط على الوظائف على نطاق واسع في مجال الاعلام.
فشبكة (إن بي سي) الإخبارية الأمريكية مثلا تتوقع أن الثورة الجديدة التي أحدثها نموذج (سورا) ستؤثر في نحو ربع وظائف صناعة إنتاج الفيديو وصناعة الأفلام في الولايات المتحدة بحلول عام 2026.
ومع ذلك يرى المراقبون أنه يصعب حتى الآن التنبؤ بتأثيرات الذكاء الاصطناعي في مستقبل الاعلام لعوامل عدة من بينها إتاحة المصدر وقضايا الملكية الفكرية التي يمكن أن تتيح أو تقيد استخدام النماذج في تدريب أدواته.
لكنهم يتوقعون أن يكون هذا العام 2024 فاصلا في انتشار تطبيقات الذكاء الاصطناعي التي كانت قبل سنوات قليلة فقط ضربا من الخيال وباتت اليوم جزءا من حياة الملايين في هذا العالم. (النهاية) ه س ص / ت م