بازينجا

سلامة الذكاء الاصطناعي

في خطوة نادرة.. OpenAI وأنثروبيك تتعاونان لكشف عيوب نماذج الذكاء الاصطناعي

Written by

Picture of فريقنا

فريقنا

Communications Consultant

في خطوة غير مسبوقة، تعاونت OpenAI وأنثروبيك، وهما من أشرس المنافسين في عالم الذكاء الاصطناعي، لتقييم نماذج بعضهما البعض بحثًا عن مشاكل مثل "الهلوسة" و"كسر الحماية". هل يمكن أن يؤدي هذا التحالف النادر إلى ذكاء اصطناعي أكثر أمانًا للجميع؟

محتويات المقالة:

مقدمة: عندما يتعاون الخصوم من أجل السلامة

في خطوة مفاجئة ونادرة، أعلنت شركتا OpenAI وأنثروبيك، وهما من أكبر الخصوم في مجال الذكاء الاصطناعي، عن تعاونهما مؤخرًا لتقييم نماذج بعضهما البعض. يهدف هذا التعاون غير المسبوق إلى فهم أفضل للمشاكل الكامنة في هذه التقنيات، مثل “الهلوسة” (اختلاق الحقائق) و”كسر الحماية” (jailbreaking)، والتي قد لا تكتشفها اختبارات السلامة الداخلية لكل شركة على حدة.

ماذا تضمن هذا التعاون؟

في منشورات متزامنة على مدونتي الشركتين، كشفت OpenAI وأنثروبيك أنهما أجرتا خلال الصيف تقييمات سلامة على النماذج المتاحة للجمهور للشركة الأخرى. لم يقتصر الاختبار على اكتشاف السلوكيات الضارة المحتملة، بل شمل أيضًا فحص ميل النماذج لاختلاق الحقائق وعدم التوافق، وهو مصطلح يستخدم لوصف عدم قيام نموذج الذكاء الاصطناعي بما يريده مطوروه. تم إجراء هذه التقييمات قبل إطلاق OpenAI لنموذجها الجديد GPT-5، وقبل طرح أنثروبيك لآخر تحديث لنموذجها Claude Opus 4.1.

لماذا الآن؟ ضغوط متزايدة لمعالجة المخاطر

يأتي هذا التعاون في وقت تتعرض فيه شركات الذكاء الاصطناعي لضغوط متزايدة للتركيز على سلامة منتجاتها. تأتي هذه الضغوط في أعقاب سلسلة من التقارير عن سلوكيات ضارة مرتبطة بالاستخدام المكثف للنماذج. وأحدث هذه الحالات هي الدعوى القضائية التي رفعت ضد OpenAI في وقت سابق من هذا الأسبوع، والتي تزعم أن مراهقًا توفي منتحرًا بعد استخدام روبوت الدردشة كـ”مدرب”. تسلط هذه الحوادث الضوء على الحاجة الملحة لأساليب اختبار أكثر قوة وشمولية.

“أول تمرين رئيسي مشترك”: سابقة في الصناعة

وصفت OpenAI هذا الجهد المشترك بأنه «أول تمرين رئيسي عبر المختبرات في اختبار السلامة والتوافق». وأضافت الشركة أن المجموعة تأمل في أن يوفر هذا «مسارًا قيمًا لتقييم السلامة على مستوى الصناعة». إن قيام شركتين متنافستين بمشاركة نقاط الضعف المحتملة في منتجاتهما هو أمر غير معتاد في عالم التكنولوجيا شديد التنافسية، ويشير إلى إدراك متزايد بأن مخاطر الذكاء الاصطناعي هي مشكلة مشتركة تتطلب حلولاً جماعية.

التركيز على الهلوسة وكسر الحماية

كانت “الهلوسة”—حيث تقدم نماذج الذكاء الاصطناعي معلومات غير صحيحة بثقة—مشكلة مستمرة تعيق موثوقيتها. أما “كسر الحماية”، فهو عندما يتمكن المستخدمون من خداع النموذج لتجاوز ضمانات السلامة الخاصة به وتقديم استجابات ضارة أو غير لائقة. من خلال اختبار نماذج بعضهما البعض، تأمل الشركتان في الحصول على منظور خارجي حول كيفية حدوث هذه المشكلات وتطوير دفاعات أفضل. يمكن لفريق من شركة منافسة أن يفكر في طرق للهجوم قد لا يفكر فيها الفريق الداخلي.

تاريخ من المنافسة: من زملاء إلى خصوم

يجعل تاريخ الشركتين هذا التعاون أكثر أهمية. تأسست أنثروبيك على يد موظفين سابقين في OpenAI غادروا الشركة بسبب خلافات حول اتجاهها، خاصة فيما يتعلق بالسلامة. منذ ذلك الحين، أصبحت الشركتان منافسين شرسين، حيث تتسابق كل منهما لتطوير نماذج أكثر قوة وجذب العملاء والتمويل. أن يضعا هذه المنافسة جانبًا، ولو مؤقتًا، من أجل السلامة هو علامة إيجابية للصناعة.

الخاتمة: هل يمكن أن يصبح التعاون هو القاعدة الجديدة؟

يمثل هذا التعاون النادر بين OpenAI وأنثروبيك لحظة نضج محتملة لصناعة الذكاء الاصطناعي. إنه اعتراف بأن التحديات المتعلقة بالسلامة أكبر من أي شركة واحدة، وأن الشفافية والتعاون قد يكونان ضروريين لبناء ثقة الجمهور وضمان تطوير هذه التكنولوجيا القوية بشكل مسؤول. يبقى أن نرى ما إذا كانت هذه ستكون مبادرة لمرة واحدة أم بداية لاتجاه جديد نحو معايير سلامة مشتركة في الصناعة. ومع ذلك، فهي خطوة في الاتجاه الصحيح في وقت تشتد فيه الحاجة إلى ذلك.

أسئلة شائعة

س: لماذا يعتبر هذا التعاون مهمًا؟
ج: لأنه يمثل المرة الأولى التي يقوم فيها اثنان من أكبر المنافسين في مجال الذكاء الاصطناعي بتقييم نماذج بعضهما البعض بشكل منهجي من أجل السلامة، مما قد يؤدي إلى اكتشاف نقاط ضعف لم تكن لتظهر في الاختبارات الداخلية.

س: ما هي “هلوسة” الذكاء الاصطناعي؟
ج: هي ظاهرة تقوم فيها نماذج الذكاء الاصطناعي بإنشاء معلومات غير صحيحة أو لا أساس لها من الصحة وتقديمها كحقيقة، وذلك بسبب طبيعة طريقة عملها القائمة على التنبؤ الإحصائي.

س: هل ستشارك الشركتان النتائج مع الجمهور؟
ج: لم تذكر الشركتان تفاصيل حول كيفية مشاركة النتائج، لكن الإعلان عن التعاون نفسه هو خطوة نحو مزيد من الشفافية في الصناعة.

شارك هذا الموضوع:

شارك هذا الموضوع:

اترك رد

اترك رد

المنشورات الأخيرة

اكتشاف المزيد من بازينجا

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading