ابتكار, الشركات الناشئة, ذكاء اصطناعي, تكنولوجيا

شركة OpenAGI تطلق نموذج «لوكس» للتحكم بالكمبيوتر

Written by

فريقنا

Communications Consultant

خرجت شركة الذكاء الاصطناعي الناشئة OpenAGI إلى العلن مع إطلاق نموذج «لوكس» (Lux)، المصمم للتحكم في أجهزة الكمبيوتر بشكل مستقل. تدعي الشركة أن نموذجها يتفوق بشكل كبير على أنظمة OpenAI و Anthropic في تنفيذ المهام عبر التطبيقات، مما يشعل المنافسة في مجال وكلاء الذكاء الاصطناعي.

فريقنا

محتويات المقالة:

ادعاء طموح في عالم الوكلاء الأذكياء

ظهرت شركة ناشئة في مجال الذكاء الاصطناعي، أسسها باحث من معهد ماساتشوستس للتكنولوجيا (MIT)، بادعاء طموح: نموذجها الجديد للذكاء الاصطناعي يمكنه التحكم في أجهزة الكمبيوتر بشكل أفضل من الأنظمة التي بنتها شركات عملاقة مثل OpenAI و Anthropic، وبجزء بسيط من التكلفة.

يأتي هذا الإعلان في لحظة محورية لصناعة الذكاء الاصطناعي، حيث استثمرت الشركات مليارات الدولارات في تطوير وكلاء مستقلين (Autonomous Agents) قادرين على التنقل في البرامج، وحجز السفر، وملء النماذج، وتنفيذ مهام سير العمل المعقدة. السباق محتدم لبناء ذكاء اصطناعي يمكنه أن يكون مساعداً تنفيذياً رقمياً حقيقياً.

نموذج لوكس: أداء متفوق بتكلفة أقل

أصدرت شركة OpenAGI، بقيادة الرئيس التنفيذي زينجي تشين، نموذج «لوكس» (Lux)، وهو نموذج تأسيسي مصمم لتشغيل أجهزة الكمبيوتر بشكل مستقل عن طريق تفسير لقطات الشاشة وتنفيذ الإجراءات عبر تطبيقات سطح المكتب.

وقال تشين في مقابلة حصرية مع VentureBeat: «التدريب التقليدي للنماذج اللغوية الكبيرة يغذي النموذج بالنصوص لإنتاج نصوص. على النقيض من ذلك، يتعلم نموذجنا إنتاج أفعال. يتم تدريب النموذج بكمية كبيرة من لقطات شاشة الكمبيوتر وتسلسلات الإجراءات، مما يسمح له بإنتاج أفعال للتحكم في الكمبيوتر».

التفوق على المعايير القياسية الصارمة

تدعي الشركة أن لوكس يحقق معدل نجاح يبلغ 83.6% في معيار Online-Mind2Web، وهو اختبار أصبح الأكثر صرامة في الصناعة لتقييم وكلاء الذكاء الاصطناعي الذين يتحكمون في أجهزة الكمبيوتر.

تعتبر هذه النتيجة قفزة كبيرة مقارنة بالنماذج الرائدة. يسجل نموذج Operator من OpenAI نسبة 61.3%، ويحقق نموذج Claude Computer Use من Anthropic نسبة 56.3%. تم تصميم معيار Online-Mind2Web خصيصاً لاختبار الوكلاء في بيئات حية عبر الإنترنت حيث تتغير الصفحات ديناميكياً وتظهر عقبات غير متوقعة، مما يجعله مقياساً موثوقاً للأداء الفعلي.

السر وراء التفوق: منهجية تدريب مبتكرة

ينبع تفوق OpenAGI المزعوم مما تسميه الشركة «التدريب المسبق النشط الوكيلي» (Agentic Active Pre-training). بدلاً من التدريب على نصوص ثابتة، يتدرب لوكس على لقطات الشاشة والإجراءات، ويتعلم تفسير الواجهات المرئية وتحديد الخطوات اللازمة لتحقيق هدف معين.

أوضح تشين: «يسمح الإجراء للنموذج باستكشاف بيئة الكمبيوتر بنشاط، وهذا الاستكشاف يولد معرفة جديدة، والتي يتم تغذيتها مرة أخرى إلى النموذج للتدريب». هذه عملية تتطور ذاتياً بشكل طبيعي، حيث يؤدي النموذج الأفضل إلى استكشاف أفضل، والاستكشاف الأفضل ينتج معرفة أفضل، والمعرفة الأفضل تؤدي إلى نموذج أفضل. هذه الحلقة التدريبية ذاتية التعزيز قد تفسر كيف يمكن لفريق أصغر تحقيق نتائج تتفوق على المنظمات الأكبر.

تجاوز حدود المتصفح: التحكم في سطح المكتب

هناك تمييز حاسم آخر: يمكن لـ لوكس التحكم في التطبيقات عبر نظام تشغيل سطح المكتب بأكمله، وليس فقط متصفحات الويب. تركز معظم الوكلاء المتاحين تجارياً بشكل أساسي على المهام المستندة إلى المتصفح.

تقول OpenAGI إن لوكس يمكنه التنقل في التطبيقات الأصلية مثل Microsoft Excel أو Slack أو برامج التصميم، وهي قدرة من شأنها أن توسع بشكل كبير السوق المستهدف لوكلاء استخدام الكمبيوتر.

تعمل الشركة أيضاً مع إنتل لتحسين لوكس للأجهزة الطرفية، مما سيسمح للنموذج بالعمل محلياً على أجهزة الكمبيوتر المحمولة بدلاً من الحاجة إلى بنية تحتية سحابية، مما يعالج مخاوف الخصوصية المتعلقة بإرسال بيانات الشاشة الحساسة إلى خوادم خارجية.

تحديات السلامة والأمان

يقدم وكلاء استخدام الكمبيوتر تحديات سلامة جديدة. يمكن لنظام الذكاء الاصطناعي القادر على النقر فوق الأزرار وإدخال النص، إذا تم توجيهه بشكل خاطئ، أن يتسبب في ضرر كبير، مثل تحويل الأموال أو حذف الملفات أو تسريب المعلومات الحساسة.

تقول OpenAGI إنها بنت آليات أمان مباشرة في لوكس. عندما يواجه النموذج طلبات تنتهك سياسات السلامة الخاصة به، فإنه يرفض المتابعة وينبه المستخدم. على سبيل المثال، إذا طُلب منه نسخ التفاصيل المصرفية، يستجيب لوكس بأنه لا يستطيع تنفيذ هذا الإجراء بناءً على سياسة الأمان.

يبقى السؤال المركزي هو ما إذا كانت OpenAGI تستطيع ترجمة الهيمنة على المعايير إلى موثوقية في العالم الحقيقي. ولكن إذا كان أداء لوكس في الواقع كما هو في المختبر، فإن ذلك يشير إلى أن الطريق إلى وكلاء الذكاء الاصطناعي القادرين لا يمر عبر أكبر الميزانيات، بل عبر أذكى البنى الهندسية.

أسئلة شائعة

س: ما هو نموذج لوكس (Lux) من OpenAGI؟
ج: هو نموذج ذكاء اصطناعي (وكيل ذكي) مصمم للتحكم في أجهزة الكمبيوتر بشكل مستقل، حيث يمكنه فهم واجهة المستخدم الرسومية واتخاذ إجراءات (مثل النقر والكتابة) لتنفيذ المهام عبر مختلف التطبيقات.

س: كيف يختلف لوكس عن ChatGPT أو النماذج الأخرى؟
ج: بينما تركز معظم النماذج على توليد النصوص، تم تدريب لوكس خصيصاً على إنتاج «أفعال» للتحكم في الكمبيوتر. يتعلم من خلال تحليل لقطات الشاشة وتسلسلات الإجراءات بدلاً من النصوص فقط.

س: ما مدى جودة أداء لوكس مقارنة بالمنافسين؟
ج: تدعي OpenAGI أن لوكس حقق معدل نجاح بنسبة 83.6% في معيار Online-Mind2Web الصارم، متفوقاً بشكل كبير على نماذج OpenAI (61.3%) و Anthropic (56.3%)، ويعمل بتكلفة أقل بكثير.

س: ما هي منهجية التدريب المبتكرة التي تستخدمها OpenAGI؟
ج: تستخدم منهجية «التدريب المسبق النشط الوكيلي»، حيث يتدرب النموذج على لقطات الشاشة وتسلسلات الإجراءات، ويستكشف بيئة الكمبيوتر بنشاط لتوليد معرفة جديدة وتحسين نفسه باستمرار في حلقة ذاتية التطور.