أعلنت جوجل عن دخولها حقبة جديدة بإطلاق «جيميني 3» (Gemini 3)، واصفة إياه بأنه النموذج «الأكثر ذكاءً ودقة في الحقائق» حتى الآن. يمثل هذا الإطلاق خطوة كبيرة نحو الذكاء الاصطناعي العام (AGI) وفرصة لجوجل للتفوق في سباق الذكاء الاصطناعي، مقدماً نموذجاً قوياً بقدرات فائقة في الفهم متعدد الوسائط والبرمجة والتخطيط، مع التركيز على تقديم تجربة مستخدم بصرية وتفاعلية تتجاوز الردود النصية التقليدية.
محتويات المقالة:
- بداية عصر جيميني 3
- وضع التفكير العميق: حدود جديدة للذكاء
- تعلم أي شيء: قوة الفهم متعدد الوسائط
- بناء أي شيء: ثورة في البرمجة
- تخطيط أي شيء: الوكلاء الأذكياء
- تجربة المستخدم: واجهات توليدية وردود مباشرة
- التوافر والمستقبل
- أسئلة شائعة
بداية عصر جيميني 3
تستهل جوجل هذا العصر بإصدار «جيميني 3 برو» (Gemini 3 Pro) في مرحلة المعاينة، وإتاحته عبر مجموعة من منتجات جوجل ليتمكن المستخدمون من الاستفادة منه في حياتهم اليومية للتعلم والبناء والتخطيط. ولأول مرة، تتيح جوجل للجميع الوصول إلى نموذجها الرائد في تطبيق جيميني من اليوم الأول.
صرح ديمس هاسابيس، الرئيس التنفيذي لشركة جوجل ديب مايند، وكوراي كافوكشوغلو، كبير مسؤولي التكنولوجيا، بأن جيميني 3 هو «أفضل نموذج في العالم للفهم متعدد الوسائط وأقوى نموذج للبرمجة الوكيلية حتى الآن، حيث يقدم تصورات أكثر ثراءً وتفاعلية أعمق، وكل ذلك مبني على أساس التفكير المنطقي المتطور».
وضع التفكير العميق: حدود جديدة للذكاء
تقدم جوجل أيضاً وضع «التفكير العميق لجيميني 3» (Gemini 3 Deep Think)، وهو وضع تفكير محسّن يدفع أداء جيميني 3 إلى أبعد من ذلك. يهدف هذا الوضع إلى تحقيق نقلة نوعية في قدرات التفكير والفهم متعدد الوسائط لمساعدة المستخدمين على حل المشكلات الأكثر تعقيداً.
في الاختبارات، أظهر وضع التفكير العميق أداءً غير مسبوق. لقد تفوق على أداء جيميني 3 برو في اختبارات صعبة مثل (GPQA Diamond) محققاً نسبة 93.8%، كما حقق نسبة 45.1% في اختبار (ARC-AGI-2)، مما يدل على قدرته على مواجهة التحديات الجديدة ببراعة. هذا الوضع متاح حالياً لمختبري السلامة قبل إتاحته لمشتركي (Google AI Ultra).
تعلم أي شيء: قوة الفهم متعدد الوسائط
تم تصميم جيميني منذ البداية لدمج المعلومات بسلاسة عبر وسائط متعددة، بما في ذلك النصوص والصور والفيديو والصوت والبرمجة. يدفع جيميني 3 حدود التفكير متعدد الوسائط لمساعدة المستخدمين على التعلم بطرق جديدة تماماً، مستفيداً من نافذة سياق تبلغ 1 مليون رمز.
على سبيل المثال، إذا كنت ترغب في تعلم الطبخ التقليدي لعائلتك، يمكن لجيميني 3 فك شفرة وترجمة الوصفات المكتوبة بخط اليد بلغات مختلفة وتحويلها إلى كتاب طبخ عائلي قابل للمشاركة. وإذا كنت ترغب في تعلم موضوع جديد، يمكنك تزويده بأوراق أكاديمية أو محاضرات فيديو طويلة، ويمكنه إنشاء بطاقات تعليمية تفاعلية أو تصورات لمساعدتك على إتقان المادة. يمكنه حتى تحليل مقاطع فيديو لمباراة رياضية، وتحديد مجالات التحسين، ووضع خطة تدريبية لك.
بناء أي شيء: ثورة في البرمجة
يعد جيميني 3 أفضل نموذج برمجة قامت جوجل ببنائه على الإطلاق، مما يعزز إنتاجية المطورين بشكل كبير. إنه استثنائي في التعامل مع الأوامر والتعليمات المعقدة لتقديم واجهات ويب أكثر ثراءً وتفاعلية.
يتصدر جيميني 3 لوحة المتصدرين في (WebDev Arena) بدرجة مذهلة تبلغ 1487 (Elo). كما يسجل 54.2% في (Terminal-Bench 2.0)، الذي يختبر قدرة النموذج على تشغيل جهاز كمبيوتر عبر الطرفية. كما يتفوق بشكل كبير على النماذج السابقة في معيار (SWE-bench Verified) بنسبة 76.2%. يمكن للمطورين الآن البناء باستخدام جيميني 3 في (Google AI Studio)، و(Vertex AI)، ومنصات أخرى مثل (GitHub) و(Replit).
تخطيط أي شيء: الوكلاء الأذكياء
لقد تحسنت قدرة جيميني 3 على التخطيط الموثوق للمستقبل على مدى أطول. يتصدر النموذج لوحة المتصدرين في (Vending-Bench 2)، الذي يختبر التخطيط طويل المدى من خلال إدارة أعمال آلة بيع محاكاة. حافظ جيميني 3 برو على اتخاذ قرارات متسقة لمدة عام كامل محاكاة، محققاً عوائد أعلى دون الانحراف عن المهمة.
يعمل النموذج أيضاً على تشغيل ميزة «وكيل جيميني» (Gemini Agent) التجريبية التي يمكنها أداء المهام نيابة عنك داخل تطبيق جيميني، مثل مراجعة رسائل البريد الإلكتروني وتنظيمها، أو البحث عن رحلات السفر وحجزها.
تجربة المستخدم: واجهات توليدية وردود مباشرة
في تطبيق جيميني، يمكن للمستخدمين تجربة «واجهات توليدية»، وهي أداة تسمح لجيميني 3 بإنشاء تنسيق مرئي يشبه المجلة مع صور يمكن تصفحها، أو تخطيط ديناميكي مخصص لطلبك، بدلاً من مجرد ردود نصية.
في وضع الذكاء الاصطناعي (AI Mode) ضمن بحث جوجل، سيقدم لك جيميني 3 برو عناصر مرئية مثل الجداول والشبكات والمحاكاة التفاعلية بناءً على استفسارك.
كما تؤكد جوجل أن جيميني 3 برو أقل عرضة للمجاملة الفارغة أو «التملق»، في إشارة واضحة إلى المشكلات التي واجهتها نماذج منافسة مثل (ChatGPT). تصف جوجل استجابات النموذج بأنها «ذكية وموجزة ومباشرة، تستبدل الكليشيهات والمجاملات برؤى حقيقية – تخبرك بما تحتاج إلى سماعه، وليس فقط ما تريد سماعه».
التوافر والمستقبل
يتوفر جيميني 3 برو داخل تطبيق جيميني للجميع بدءاً من اليوم. يمكن لمشتركي (Google AI Pro) و(Ultra) في الولايات المتحدة تجربة جيميني 3 برو داخل وضع الذكاء الاصطناعي. يمثل هذا الإطلاق لحظة محورية في تطور الذكاء الاصطناعي، ويضع جوجل في طليعة الابتكار في هذا المجال المتسارع.
أسئلة شائعة
ما هو جيميني 3؟
جيميني 3 هو أحدث وأقوى نموذج ذكاء اصطناعي من جوجل، مصمم للفهم متعدد الوسائط (نصوص، صور، فيديو، صوت) ويتميز بقدرات فائقة في البرمجة والتخطيط.
ما الفرق بين جيميني 3 برو ووضع التفكير العميق؟
جيميني 3 برو هو النموذج الأساسي المتاح للجمهور والمطورين. وضع التفكير العميق هو نسخة محسّنة بقدرات تفكير منطقي أعلى لحل المشكلات المعقدة جداً، وهو متاح حالياً لمختبري السلامة فقط.
كيف يمكنني استخدام جيميني 3؟
يمكن استخدامه عبر تطبيق جيميني، وضمن بحث جوجل (للمشتركين في البداية)، وعبر منصات المطورين مثل (Google AI Studio) و(Vertex AI).