كشف تقرير حصري أن غوغل تستخدم مكتبتها الضخمة من مقاطع فيديو يوتيوب لتدريب نماذج الذكاء الاصطناعي، مما يثير مخاوف حول حقوق الملكية الفكرية وموافقة منشئي المحتوى.
محتويات المقالة:
- مقدمة
- الاكتشاف
- نطاق الاستخدام
- ردود فعل المنشئين
- التفاصيل التقنية
- الآثار القانونية
- تأثير على الصناعة
- الخاتمة
مقدمة
تستخدم غوغل مكتبتها الواسعة من مقاطع فيديو يوتيوب لتدريب نماذج الذكاء الاصطناعي الخاصة بها، بما في ذلك جيميني ومولد الفيديو والصوت فيو 3، وفقاً لما تعلمته شبكة CNBC. أكدت الشركة لشبكة CNBC أنها تعتمد على خزانة مقاطع فيديو يوتيوب لتدريب نماذج الذكاء الاصطناعي الخاصة بها، لكن غوغل قالت إنها تستخدم فقط مجموعة فرعية من مقاطعها للتدريب.
هذا الاستخدام لمقاطع فيديو يوتيوب لديه القدرة على إثارة أزمة ملكية فكرية لمنشئي المحتوى وشركات الإعلام، قال خبراء. تتجه الشركة التقنية إلى كتالوجها المكون من 20 مليار مقطع فيديو على يوتيوب لتدريب هذه الأدوات الذكية من العصر الجديد، وفقاً لشخص لم يكن مخولاً للتحدث علناً حول الأمر.
صانعة محتوى تتحدى السارقين: تسميم النصوص لحماية الإبداع
الاكتشاف
أكدت غوغل لشبكة CNBC أنها تعتمد على خزانة مقاطع فيديو يوتيوب لتدريب نماذج الذكاء الاصطناعي الخاصة بها، لكن الشركة قالت إنها تستخدم فقط مجموعة فرعية من مقاطعها للتدريب وأنها تكرم الاتفاقيات المحددة مع منشئي المحتوى وشركات الإعلام.
قال متحدث باسم يوتيوب في بيان: «لقد استخدمنا دائماً محتوى يوتيوب لجعل منتجاتنا أفضل، وهذا لم يتغير مع ظهور الذكاء الاصطناعي. نحن نقر أيضاً بالحاجة إلى ضوابط، وهذا هو السبب في أننا استثمرنا في حماية قوية تسمح لمنشئي المحتوى بحماية صورتهم وشبههم في عصر الذكاء الاصطناعي – شيء نحن ملتزمون بمواصلته».
نطاق الاستخدام
بينما يقول يوتيوب إنه شارك هذه المعلومات سابقاً، قال خبراء تحدثوا مع CNBC إنه ليس مفهوماً على نطاق واسع من قبل منشئي المحتوى والمنظمات الإعلامية أن غوغل تدرب نماذج الذكاء الاصطناعي الخاصة بها باستخدام مكتبة الفيديو الخاصة بها.
لم يذكر يوتيوب كم من 20 مليار مقطع فيديو على منصته أو أيها يُستخدم للتدريب على الذكاء الاصطناعي. لكن نظراً لحجم المنصة، فإن التدريب على 1% فقط من الكتالوج سيصل إلى 2.3 مليار دقيقة من المحتوى، والذي يقول الخبراء إنه أكثر من 40 مرة من بيانات التدريب المستخدمة بواسطة نماذج الذكاء الاصطناعي المنافسة.
ردود فعل المنشئين
تحدثت CNBC مع عدة منشئين رائدين ومحترفين في الملكية الفكرية، ولم يكن أي منهم على علم أو تم إعلامه من قبل يوتيوب أن محتواهم يمكن أن يُستخدم لتدريب نماذج الذكاء الاصطناعي من غوغل. قال لوك أريغوني، الرئيس التنفيذي لشركة لوتي، وهي شركة تعمل على حماية الهوية الرقمية لمنشئي المحتوى: «من المحتمل أنهم يأخذون بيانات من الكثير من منشئي المحتوى الذين أمضوا الكثير من الوقت والطاقة وفكرهم الخاص في وضع هذه المقاطع».
أضاف: «إنه يساعد نموذج فيو 3 على صنع نسخة اصطناعية، تقليد ضعيف، لهؤلاء المنشئين. هذا ليس عادلاً بالضرورة لهم». الكشف أن يوتيوب يدرب على مقاطع المستخدمين أمر جدير بالملاحظة بعد أن أعلنت غوغل في مايو عن فيو 3، أحد أكثر مولدات الفيديو بالذكاء الاصطناعي تقدماً في السوق.
التفاصيل التقنية
في كشفها، عرضت غوغل مشاهد فيديو بمستوى سينمائي، بما في ذلك مشهد لرجل عجوز على قارب وآخر يظهر حيوانات تشبه بيكسار تتحدث مع بعضها البعض. كانت المشاهد بأكملها، المرئية والصوتية، مولدة بالكامل بالذكاء الاصطناعي. وفقاً ليوتيوب، يتم تحميل متوسط 20 مليون مقطع فيديو إلى المنصة يومياً من قبل منشئين مستقلين من قبل تقريباً كل شركة إعلام رئيسية.
يقول العديد من منشئي المحتوى إنهم الآن قلقون من أنهم قد يساعدون دون علم في تدريب نظام يمكن أن ينافسهم أو يحل محلهم في النهاية. قال أريغوني: «لا يضر ميزتهم التنافسية على الإطلاق أن يخبروا الناس أي نوع من المقاطع يدربون عليها وكم عددها». «الشيء الوحيد الذي سيؤثر عليه حقاً هو علاقتهم بمنشئي المحتوى».
الآثار القانونية
حتى لو لم تكن مخرجات فيو 3 النهائية تكرر العمل الموجود مباشرة، فإن المحتوى المولد يغذي أدوات تجارية يمكن أن تنافس منشئي المحتوى الذين جعلوا بيانات التدريب ممكنة، كل ذلك دون ائتمان أو موافقة أو تعويض، قال خبراء. عند تحميل مقطع فيديو إلى المنصة، يوافق المستخدم على أن يوتيوب لديه ترخيص واسع للمحتوى.
تنص شروط الخدمة: «من خلال توفير المحتوى للخدمة، تمنح يوتيوب ترخيصاً عالمياً وغير حصري وخالياً من الإتاوات وقابلاً للترخيص من الباطن وقابلاً للتحويل لاستخدام ذلك المحتوى». قال دان نيلي، الرئيس التنفيذي لشركة فيرميليو، التي تساعد الأفراد على حماية شبههم من سوء الاستخدام وتسهل أيضاً الترخيص الآمن للمحتوى المعتمد: «لقد رأينا عدداً متزايداً من منشئي المحتوى يكتشفون نسخاً مزيفة من أنفسهم تنتشر عبر المنصات – أدوات جديدة مثل فيو 3 ستسرع هذا الاتجاه فقط».
تأثير على الصناعة
تتحدى شركة نيلي منصات الذكاء الاصطناعي لتوليد محتوى يُزعم أنه ينتهك الملكية الفكرية لعملائها، الفردية والشركات. يقول نيلي أنه رغم أن يوتيوب لديه الحق في استخدام هذا المحتوى، فإن العديد من منشئي المحتوى الذين ينشرون على المنصة غير مدركين أن مقاطعهم تُستخدم لتدريب برامج توليد الفيديو بالذكاء الاصطناعي.
تستخدم شركة فيرميليو أداة مملوكة تسمى تريس آي دي لتقييم ما إذا كان مقطع فيديو مولد بالذكاء الاصطناعي له تداخل كبير مع مقطع فيديو أنشأه إنسان. تعطي تريس آي دي درجات على مقياس من صفر إلى 100. أي درجة أكثر من 10 لمقطع فيديو مع صوت تعتبر ذات مغزى، قال نيلي.
في مثال واحد استشهد به نيلي، تطابق مقطع فيديو من منشئ يوتيوب برودي موس بشكل وثيق مع محتوى مولد بواسطة فيو 3. أعطت تريس آي دي درجة 71 للفيديو الأصلي مع تسجيل الصوت وحده أكثر من 90.
الخاتمة
هذا الكشف يفتح نقاشاً مهماً حول مستقبل حقوق منشئي المحتوى في عصر الذكاء الاصطناعي. بينما تستفيد التقنيات العملاقة من البيانات الضخمة المتاحة لتطوير نماذجها، يجد منشئو المحتوى أنفسهم في موقف صعب حيث يساهمون دون علم في تطوير تقنيات قد تحل محلهم. الحاجة إلى شفافية أكبر وحماية أفضل لحقوق المنشئين أصبحت أكثر إلحاحاً من أي وقت مضى. المستقبل يتطلب توازناً عادلاً بين الابتكار التقني وحماية حقوق الأفراد الذين يساهمون في بناء هذه التقنيات.