علوم

باحثو مايكروسوفت يطورون نموذج بيت نيت فائق الكفاءة يعمل على المعالجات المركزية

Written by

فريقنا

Communications Consultant

أعلن باحثون في مايكروسوفت عن تطوير نموذج لغوي مضغوط باسم «BitNet b1.58 2B4T»، يُعد أكبر «نموذج بتميّة» حتى الآن، ويمكنه العمل بكفاءة على وحدات المعالجة المركزية مثل معالج أبل «إم 2».

فريقنا

أعلن باحثون في مايكروسوفت عن تطوير نموذج لغوي مضغوط باسم «بيت نيت b1.58 2B4T»، يُعد أكبر «نموذج بتميّة» حتى الآن، ويمكنه العمل بكفاءة على وحدات المعالجة المركزية مثل معالج أبل «إم 2».

محتويات المقالة:

مقدمة
تقنية “بتميّة” وكيفية عملها
أداء النموذج ومقارنته بالنماذج الأخرى
قيود ومحددات
أهمية هذه التقنية للعالم العربي
الخصوصية والأمان
خاتمة
الأسئلة الشائعة

مقدمة

في سباق مستمر نحو جعل النماذج اللغوية الكبيرة (LLMs) أكثر كفاءة وأقل استهلاكاً للموارد، كشف باحثون في مايكروسوفت عن أحدث ابتكاراتهم: نموذج «بيت نيت b1.58 2B4T». يتميز هذا النموذج بكونه مصمماً بتقنية تعرف باسم «بتميّة» (Bitnets)، وهي مقاربة كمية تجعل أوزان النموذج تقتصر على ثلاث قيم فقط: -1 و0 و1. ووفقاً لفريق البحث، يسمح ذلك بتقليل الذاكرة المستخدمة وتسريع عمليات المعالجة، ما يجعل النموذج قابلاً للتشغيل حتى على معالجات مركزية مثل «إم 2» من أبل، دون الحاجة إلى وحدات معالجة رسومية (GPUs) مكلفة.

أقوى الحواسيب الفائقة: إل كابيتان يتصدر قائمة TOP500 لعام 2024

تقنية “بتميّة” وكيفية عملها

يتكون النموذج من 2 مليار معامل (بارامتر)، مدربة على 4 تريليونات توكن من النصوص، وهو ما يجعله في مصاف النماذج اللغوية الكبيرة. ويزعم باحثو مايكروسوفت أن «بيت نيت b1.58 2B4T» يتفوق على نماذج منافسة ذات حجم مماثل مثل «لياما 3.2» من ميتا و«غيمي 3» من غوغل في اختبارات متنوعة مثل GSM8K (أسئلة في الرياضيات على مستوى ابتدائي) وPIQA (اختبارات الفهم الفيزيائي). ورغم أن الفارق ليس هائلاً، فإن الميزة الأبرز للنموذج تكمن في استهلاكه المنخفض للموارد واستخدامه المنخفض للذاكرة، ما يجعله أسرع بمقدار الضعف تقريباً من نماذج بحجم مماثل.

أداء النموذج ومقارنته بالنماذج الأخرى

أظهرت الاختبارات أن نموذج بيت نيت يتميز بسرعة معالجة أعلى مقارنة بالنماذج التقليدية، حتى عند تشغيله على وحدات معالجة مركزية عادية. هذا التحسن في الأداء يأتي من تبسيط عمليات الحساب وتخفيض احتياجات الذاكرة. وبدلاً من استخدام أرقام ذات نقطة عائمة (float) لتخزين أوزان الشبكة العصبية، يستخدم النموذج قيماً ثلاثية بسيطة، مما يسمح بتحسين كبير في سرعة المعالجة وكفاءة استخدام الموارد.

قيود ومحددات

لكن فريق مايكروسوفت اعترف بأن تحقيق هذه الكفاءة يتطلب استخدام إطار عمل خاص يسمى «bitnet.cpp»، والذي يدعم حالياً فقط عدداً محدوداً من القطع العتادية. وغابت عن القائمة وحدات معالجة الرسوميات، رغم انتشارها الواسع في البنية التحتية للذكاء الاصطناعي. ما يعني أن استخدام «BitNet b1.58 2B4T» قد يظل محصوراً في أجهزة معينة، في الأقل في هذه المرحلة.

أهمية هذه التقنية للعالم العربي

مع ذلك، يفتح هذا النهج الباب أمام تطبيقات أوسع للنماذج اللغوية في البيئات محدودة الموارد، مثل الأجهزة المحمولة والحواسيب الصغيرة. ولدى النظر إلى العالم العربي، قد تكون هذه التقنية مفيدة لتشغيل نماذج لغوية تدعم اللغة العربية محلياً على أجهزة منخفضة التكلفة، دون الحاجة لشراء عتاد باهظ الثمن أو الاعتماد كلياً على السحابة. ومع ذلك، لا يزال هناك تحد يتمثل في تهيئة البيانات العربية لتناسب نموذج «بتميّة»، إذ أن ضغط الأوزان قد يؤثر في دقة النموذج إذا كانت البيانات اللغوية أو المجالات المعجمية واسعة ومتنوعة.

الخصوصية والأمان

أهمية هذه التقنية تتضح أيضاً في ظل ازدياد الاهتمام بالخصوصية وأمان البيانات، حيث يمكن تشغيل النموذج على الجهاز المحلي عوضاً عن إرسال النصوص والبيانات إلى خوادم بعيدة. وقد يشكل هذا الحل خياراً جذاباً لبعض التطبيقات التي تتطلب حماية عالية للخصوصية، مثل المحادثات السرية أو التحليلات المالية الحساسة.

هل تقترب نهاية احتكار إنفيديا؟ أوبن أيه آي تخطو نحو المستقبل

خاتمة

وعلى الرغم من أن «نموذج بيت نيت b1.58 2B4T» لا يُعد «حلاً سحرياً» لكل تحديات تعلم الآلة، فإن نجاحه في خفض الذاكرة وتحسين السرعة يشكل إنجازاً مهماً. وتشير التوقعات إلى أن المزيد من الفرق البحثية قد تتبنى أفكاراً مشابهة في سبيل تطوير نماذج صغيرة لكنها فعالة. ويبقى السؤال الأكبر حول مدى سهولة توسيع دعم الأجهزة لدى مايكروسوفت أو المجتمع البرمجي، بحيث يصبح هذا النوع من النماذج متاحاً على طيف أوسع من العتاد.

الأسئلة الشائعة

1. ما هو مفهوم «بتميّة»؟
تقنية تهدف لتقليل دقة أوزان النموذج اللغوي إلى ثلاث قيم (-1 و0 و1)، ما يقلل مساحة الذاكرة ويسرّع عمليات المعالجة.

2. ما حجم نموذج «بيت نيت b1.58 2B4T»؟
يحتوي على ملياري معامل، وتم تدريبه على 4 تريليونات توكن من النصوص.

3. هل يتفوق على نماذج أخرى في الأداء؟
تشير اختبارات مايكروسوفت إلى تفوقه في بعض المعايير على نماذج مثل لياما 3.2 وغيمي 3، مع كونه أكثر كفاءة في الذاكرة.

4. هل يدعم وحدات معالجة الرسوميات؟
حالياً لا، إذ يتطلب إطار عمل «bitnet.cpp» وقد لا يكون متوافقاً مع وحدات معالجة الرسوميات الشائعة.

5. لماذا قد يكون هذا مهماً للدول العربية؟
يمكن تشغيل النموذج على أجهزة ذات موارد محدودة محلياً، ما يتيح تطوير تطبيقات باللغة العربية دون تكلفة عتاد مرتفعة.

6. هل يؤثر الضغط الشديد للأوزان على دقة النموذج؟
قد يحدث ذلك، لكن الباحثين يستخدمون تقنيات تعويضية للحفاظ على مستوى جيد من الدقة في المهام المختلفة.

7. هل يختلف هذا عن نهج التجزئة (Quantization) العادي؟
نعم، إذ يأخذ «بتميّة» خطوة إضافية بتحديد قيم محدودة جداً للأوزان، ما يزيد من كفاءة استخدام الذاكرة والسرعة.

8. ما مستقبل هذه النماذج؟
يتوقع توسع دعمها للأجهزة المختلفة مع مرور الوقت، ما قد يجعلها بديلاً عملياً للنماذج الضخمة التي تتطلب موارد هائلة.