بازينجا

برايفسي فلتر

أوبن إي آي تكشف عن نموذج «برايفسي فلتر» مفتوح المصدر لحماية البيانات الشخصية للشركات

Written by

Picture of فريقنا

فريقنا

Communications Consultant

أطلقت شركة «أوبن إي آي» نموذجاً جديداً مفتوح المصدر تحت اسم «برايفسي فلتر»، يهدف إلى مساعدة الشركات على اكتشاف وإخفاء المعلومات الشخصية الحساسة من النصوص محلياً، مما يعزز خصوصية البيانات قبل وصولها إلى السحابة.

أعلنت شركة «أوبن إي آي» يوم الثلاثاء عن إطلاق نموذج ذكاء اصطناعي جديد مفتوح المصدر يحمل اسم «برايفسي فلتر»، وهو نموذج متطور تم تصميمه خصيصاً لاكتشاف المعلومات الشخصية الحساسة وإخفائها من النصوص بفعالية ودقة عالية. تمثل هذه الخطوة أحدث مبادرات الشركة الرائدة لتعزيز أدوات الذكاء الاصطناعي المفتوحة المصدر الموجهة لبيئات العمل المؤسسية، حيث تركز بشكل أساسي على تحسين مسارات عمل الخصوصية وحماية البيانات.

يأتي هذا الإطلاق في وقت تتزايد فيه المخاوف المتعلقة بخصوصية البيانات في عصر الذكاء الاصطناعي السحابي، مما يجعل توفير أدوات محلية لمعالجة البيانات أمراً بالغ الأهمية للشركات والمؤسسات التي تتعامل مع معلومات سرية للعملاء.

آلية عمل النموذج الجديد والقدرات التقنية

تم نشر النموذج الجديد على منصتي «هغينغ فيس» و«غيت هاب» بموجب ترخيص «أباتشي 2.0» المفتوح، مما يتيح للمطورين والشركات استخدامه وتعديله بحرية. ومما يميز هذا النموذج تصميمه الفريد الذي يسمح بتشغيله محلياً بالكامل على أجهزة الحواسيب المحمولة القياسية، أو حتى مباشرة داخل متصفحات الويب باستخدام تقنية «ويب جي بي يو». وتمنح هذه الميزة المؤسسات قدرة فائقة على تصفية البيانات الحساسة وإزالتها من النصوص والملفات قبل أن يتم إرسالها إلى أي خوادم سحابية، مما يقلل بشكل جذري من مخاطر تسريب البيانات.

من الناحية التقنية، يعتمد نموذج «برايفسي فلتر» على بنية تصنيف الرموز ثنائية الاتجاه، ويضم حوالي 1.5 مليار معلمة إجمالية، مع تخصيص 50 مليون معلمة نشطة فقط للعمليات في أي وقت معين. ويعود الفضل في هذه الكفاءة إلى استخدامه معمارية «مزيج الخبراء» المتفرقة، والتي تتكون من 128 خبيراً مع توجيه لأفضل 4 مسارات لكل رمز. وبدلاً من توليد نصوص جديدة كما تفعل النماذج اللغوية التقليدية، يقوم هذا النموذج بتصنيف تسلسل المدخلات بالكامل في تمريرة أمامية واحدة، ثم يطبق خوارزمية فك تشفير «فيتيربي» المقيدة لإنتاج تنبؤات متماسكة ودقيقة عبر النصوص.

فئات البيانات المدعومة والقدرات الاستيعابية

يستطيع النموذج الجديد التعرف على 8 فئات رئيسية من معلومات التعريف الشخصية وإخفائها بكفاءة، وهي تشمل: الأسماء الشخصية، والعناوين الجغرافية، وعناوين البريد الإلكتروني، وأرقام الهواتف، والروابط الإلكترونية، والتواريخ، وأرقام الحسابات البنكية، بالإضافة إلى الأسرار التقنية مثل مفاتيح واجهة برمجة التطبيقات وكلمات المرور الخاصة بالأنظمة.

إضافة إلى ذلك، يدعم النموذج نافذة سياق ضخمة تصل إلى 128000 رمز، مما يمكنه من معالجة المستندات الطويلة جداً والملفات البرمجية المعقدة دون الحاجة إلى تقسيمها إلى أجزاء صغيرة. وفيما يتعلق بالأداء، حقق النموذج نتائج مبهرة في الاختبارات القياسية، حيث سجل نسبة 96 في المائة في مقياس «إف 1» على مستوى الرموز ضمن اختبار «بي آي آي ماسكينغ 300 كي»، مع معدل دقة بلغ 0.940 ومعدل استدعاء بلغ 0.980. أما في مجال اكتشاف بيانات الاعتماد والأسرار داخل الأكواد البرمجية، فقد سجل النموذج معدل استدعاء بلغ 0.965، على الرغم من أن الدقة على مستوى النطاق كانت أقل نسبياً عند 0.747.

بيانات التدريب والتطبيقات المؤسسية

أوضحت «أوبن إي آي» في بطاقة النموذج التي نشرتها في 22 أبريل، أن بيانات التدريب شملت نصوصاً متاحة للجمهور ومجموعات بيانات تركيبية تم إنشاؤها داخلياً. واللافت للنظر أن عملية التعليق التوضيحي للبيانات تمت بمساعدة نموذج ذكاء اصطناعي متطور ينتمي إلى عائلة «جي بي تي-5»، مما يشير إلى القدرات المتقدمة التي تم دمجها في مرحلة التطوير.

ومع ذلك، أكدت الشركة أن النموذج يعتبر بمثابة مكون لتقليل البيانات والحد من المخاطر، ولا يمثل ضماناً مطلقاً لإخفاء الهوية تماماً، محذرة من ضرورة استخدامه جنباً إلى جنب مع ضمانات الخصوصية والأمان الأخرى التي تعتمدها المؤسسات لحماية بنيتها التحتية.

يهدف هذا الإصدار بشكل مباشر إلى مساعدة الشركات التي تكافح لتلبية متطلبات الامتثال الصارمة بموجب قوانين حماية البيانات العالمية، مثل اللائحة العامة لحماية البيانات في أوروبا وقانون التأمين الصحي في الولايات المتحدة. وتشمل حالات الاستخدام النموذجية تنقيح النصوص قبل تخزينها أو فهرستها، وإعداد قواعد البيانات لتدريب نماذج الذكاء الاصطناعي الأخرى، بالإضافة إلى تنقيح البيانات الشخصية من وثائق الشركات، ورسائل البريد الإلكتروني، وسجلات التطبيقات.

كما سلطت الشركة الضوء على كفاءة النموذج العالية في التعديل الدقيق، حيث أظهرت الاختبارات الداخلية أن تدريب النموذج على 10 في المائة فقط من مجموعة بيانات خاصة بمجال معين، مثل النصوص الطبية والقانونية، كان كافياً لرفع درجات مقياس «إف 1» إلى أكثر من 96 في المائة. ويأتي النموذج مرفقاً بأداة تعمل عبر سطر الأوامر، مما يسمح للمستخدمين بتعديل التوازنات بين الدقة والاستدعاء في وقت التشغيل لتناسب احتياجاتهم ومستوى الصرامة المطلوب.

القيود والتحديات الحالية للنموذج

رغم هذه الإمكانيات الكبيرة، اعترفت الشركة بوجود بعض القيود والتحديات في النسخة الحالية. من بين هذه التحديات انخفاض مستوى الأداء عند التعامل مع النصوص غير الإنجليزية والنصوص المكتوبة بأحرف غير لاتينية. كما يواجه النموذج صعوبة في التعرف على اصطلاحات التسمية غير الشائعة للأسماء، ويبقى عرضة للتنسيقات العدائية المضللة، مثل إدراج فواصل الأسطر عمداً داخل الروابط الإلكترونية للتهرب من نظام الاكتشاف التلقائي.

وقد وصفت «أوبن إي آي» هذا الإصدار بأنه نسخة معاينة أولية، تهدف من خلالها إلى جمع الملاحظات والتعليقات التقنية من مجتمعات البحث المهتمة بخصوصية البيانات، تمهيداً لإصدار تحديثات مستقبلية تعالج هذه التحديات وتوسع من نطاق قدرات النموذج لتشمل لغات وسياقات أكثر تنوعاً في المستقبل القريب.

الأسئلة الشائعة

ما هو نموذج برايفسي فلتر من أوبن إي آي؟

هو نموذج ذكاء اصطناعي مفتوح المصدر تم تصميمه خصيصاً للتعرف على معلومات التعريف الشخصية في النصوص وإخفائها، مما يعزز حماية البيانات في بيئات العمل المؤسسية.

هل يعمل النموذج محلياً أم يتطلب اتصالاً بالسحابة؟

تم تصميم النموذج ليعمل محلياً بالكامل على أجهزة الحواسيب المحمولة القياسية أو حتى داخل متصفح الويب باستخدام تقنية «ويب جي بي يو»، مما يعني أن البيانات الحساسة لا تحتاج إلى إرسالها لأي خادم سحابي.

ما هي أنواع البيانات الحساسة التي يمكن للنموذج اكتشافها؟

يستطيع النموذج اكتشاف 8 فئات رئيسية تشمل: الأسماء، العناوين، عناوين البريد الإلكتروني، أرقام الهواتف، الروابط الإلكترونية، التواريخ، أرقام الحسابات، والأسرار التقنية مثل مفاتيح البرمجة وكلمات المرور.

هل يضمن النموذج إخفاء الهوية بنسبة 100 في المائة؟

لا، تعتبره الشركة أداة فعالة لتقليل البيانات وتقليص المخاطر، ولكنه ليس ضماناً مطلقاً لإخفاء الهوية، وتوصي باستخدامه كجزء من منظومة متكاملة من ضمانات الخصوصية والأمان.

شارك هذا الموضوع:

شارك هذا الموضوع:

اترك رد

اترك رد

الفئات

المنشورات الأخيرة

اكتشاف المزيد من بازينجا

اشترك الآن للاستمرار في القراءة والحصول على حق الوصول إلى الأرشيف الكامل.

Continue reading