محتويات المقالة:
- مقدمة: “نانو بنانا” يتصدر المشهد
- ما هو “نانو بنانا” بالضبط؟
- مفتاح الثورة: الحفاظ على الاتساق
- قدرات جديدة ومذهلة: تغيير الأزياء ودمج الصور
- العلامات المائية والسلامة: الشفافية أولاً
- كيف يمكنك تجربته؟
- الخاتمة: مستقبل تحرير الصور أصبح أكثر ذكاءً
مقدمة: “نانو بنانا” يتصدر المشهد
في عالم تحرير الصور بالذكاء الاصطناعي، ظهر مؤخرًا اسم غريب ومثير للفضول: “نانو بنانا”. بدأ هذا النموذج الجديد في جذب الانتباه بقدراته المذهلة التي وضعته على قمة لوحة صدارة LMArena، وهي منصة تقييم لنماذج الذكاء الاصطناعي. الآن، كشفت غوغل أن “نانو بنانا” هو في الواقع ابتكار من Google DeepMind، وأنه يتم طرحه اليوم في تطبيق Gemini، واعدًا بثورة في كيفية تعديلنا للصور.
ما هو “نانو بنانا” بالضبط؟
الاسم التقني للنموذج هو Gemini 2.5 Flash Image. يمثل هذا التحديث قفزة نوعية في قدرات تحرير الصور في Gemini، والتي تم إطلاقها لأول مرة في وقت سابق من هذا العام. يسمح تحرير الصور بالذكاء الاصطناعي للمستخدمين بتعديل الصور باستخدام توجيهات نصية بسيطة بدلاً من الحاجة إلى مهارات معقدة في برامج مثل فوتوشوب. بينما كانت النماذج السابقة قادرة على إجراء تعديلات، كانت غالبًا ما تغير عناصر غير متوقعة في الصورة بسبب طبيعتها غير الحتمية.
مفتاح الثورة: الحفاظ على الاتساق
المشكلة الكبرى في الأجيال السابقة من أدوات تحرير الصور بالذكاء الاصطناعي كانت عدم الاتساق. عند إجراء تعديل، قد يتغير وجه الشخص أو تفاصيل الخلفية بشكل غير مرغوب فيه. تقول غوغل إن “نانو بنانا” يتمتع باتساق لا مثيل له عبر التعديلات. يمكن للنموذج أن “يتذكر” التفاصيل بدلاً من “رمي النرد” في كل مرة تقوم فيها بإجراء تغيير. هذا يعني أنه يمكنك تغيير ملابس شخص ما دون تغيير ملامح وجهه.
قدرات جديدة ومذهلة: تغيير الأزياء ودمج الصور
يفتح هذا الاتساق الباب أمام استخدامات مثيرة للاهتمام:
- تغيير الأسلوب والملابس: يمكنك تحميل صورة لشخص ما وتغيير ملابسه أو أسلوبه بسهولة. على سبيل المثال، يمكنك إعادة تصور شخص ما كمصارع ثيران أو شخصية من مسلسل كوميدي من التسعينيات، وستبقى النتائج تشبه الشخص في الصورة الأصلية.
- دمج صور متعددة: يمكن لـ Gemini الآن دمج صور متعددة. في المثال الذي قدمته غوغل، تم أخذ صور منفصلة لامرأة وكلب واستخدامها لإنشاء لقطة جديدة للكلب وهو يحصل على عناق. يمكنه أيضًا دمج الأشياء بطرق أكثر تجريدية لإنشاء أي شيء تطلبه تقريبًا.
- تعديلات متكررة: يمكنك الآن إجراء تعديلات متتالية. ابدأ بغرفة فارغة، ثم اطلب من Gemini طلاء الجدران، ثم أضف رف كتب، ثم أثاثًا، كل ذلك مع الحفاظ على اتساق المشهد.
العلامات المائية والسلامة: الشفافية أولاً
كما هو الحال مع نماذج غوغل الأخرى لتوليد الصور، تأتي جميع الصور الناتجة عن Gemini 2.5 Flash Image دائمًا مع علامة مائية مرئية “AI” في الزاوية. تحتوي الصورة أيضًا على علامة مائية رقمية غير مرئية تسمى SynthID يمكن اكتشافها حتى بعد التعديل المعتدل، وذلك لضمان الشفافية والقدرة على تمييز المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي.
كيف يمكنك تجربته؟
يمكنك تجربة ميزات تحرير الصور الجديدة اليوم في تطبيق Gemini، وهي متاحة عالميًا لكل من المستخدمين الذين يدفعون والمستخدمين المجانيين. تقول غوغل إن نموذج الصور الجديد سيتم طرحه قريبًا أيضًا في Gemini API و AI Studio و Vertex AI للمطورين، مما يفتح الباب أمام دمج هذه القدرات في مجموعة واسعة من التطبيقات والخدمات.
الخاتمة: مستقبل تحرير الصور أصبح أكثر ذكاءً
يمثل إطلاق “نانو بنانا” خطوة مهمة إلى الأمام في جعل تحرير الصور بالذكاء الاصطناعي أداة عملية وموثوقة. من خلال حل مشكلة الاتساق، تفتح غوغل الباب أمام إمكانيات إبداعية لم تكن ممكنة من قبل، وتقربنا من مستقبل يمكن فيه لأي شخص تحويل رؤيته البصرية إلى حقيقة ببضع كلمات فقط. إنها أداة قوية، ومع استمرار تقدمها، ستصبح الحدود بين ما هو حقيقي وما هو مُنشأ أكثر ضبابية من أي وقت مضى.
أسئلة شائعة
س: هل أحتاج إلى اشتراك مدفوع لاستخدام هذه الميزة؟
ج: لا، تقول غوغل إن التحديث متاح لكل من مستخدمي Gemini المدفوعين والمجانيين على مستوى العالم.
س: ما هي أكبر ميزة لنموذج “نانو بنانا” الجديد؟
ج: أكبر ميزة هي قدرته على الحفاظ على الاتساق في الصورة عبر تعديلات متعددة، مما يعني أن ملامح الأشياء والأشخاص الرئيسيين لا تتغير بشكل عشوائي عند تعديل جوانب أخرى من الصورة.
س: كيف يمكنني معرفة ما إذا كانت الصورة قد تم إنشاؤها بواسطة Gemini؟
ج: تضع غوغل علامة مائية مرئية “AI” على الصور، بالإضافة إلى علامة رقمية غير مرئية تسمى SynthID للمساعدة في تحديد المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي.