مقدمة
في خطوة ابتكارية تهدف إلى توسيع حدود الإبداع الرقمي وتمكين المستخدمين من استكشاف آفاق فنية جديدة، منحت شركة جوجل تطبيقها الشهير للذكاء الاصطناعي، جيميني، قدرة فائقة وغير مسبوقة تتمثل في ابتكار وتوليد مقطوعات موسيقية متكاملة. وتأتي هذه الميزة الثورية بفضل دمج أحدث نموذج صوتي متطور تم تصميمه وتطويره بعناية فائقة بواسطة مختبرات ديب مايند الرائدة والتابعة للشركة. وقد بدأ بالفعل طرح الوصول التجريبي إلى هذا النموذج السمعي المبتكر، والذي يحمل اسم ليريا 3، بشكل تدريجي داخل واجهة تطبيق جيميني، مما يتيح للمستخدمين في جميع أنحاء العالم تجربة توليد مقطوعات موسيقية قصيرة ومدهشة تصل مدتها إلى 30 ثانية. يتميز هذا النظام بقدرته على تلقي أوامر نصية بسيطة، أو حتى تحليل الصور ومقاطع الفيديو، لإنتاج مقاطع صوتية مخصصة دون الحاجة المزعجة لمغادرة نافذة الدردشة الأصلية للتطبيق.
- قدرات نموذج الصوت المتطور ليريا 3
- تحويل النصوص المكتوبة إلى مقطوعات موسيقية
- دمج الصور والفيديوهات في الإبداع الموسيقي
- الانتشار العالمي واللغات المتوفرة للاستخدام
- مستقبل الإبداع والتطوير الصوتي المتقدم
- أسئلة شائعة
قدرات نموذج الصوت المتطور ليريا 3
يمثل نموذج الذكاء الاصطناعي ليريا 3 قفزة هائلة في مجال المعالجة الصوتية وتوليد الإشارات السمعية المعقدة. فقد تم تدريب هذا النظام المتقدم باستخدام قواعد بيانات صوتية وموسيقية ضخمة لتمكينه من فهم التراكيب الإيقاعية الدقيقة والأنماط اللحنية المتنوعة بدقة متناهية. ويسمح هذا النموذج للمستخدمين غير المحترفين بإنتاج وتوليد مقطوعات صوتية عالية الجودة في غضون ثوان معدودة. وتُعد ميزة توليد 30 ثانية من الموسيقى كافية تماما لصناع المحتوى الرقمي عبر منصات التواصل الاجتماعي، الذين يبحثون باستمرار عن مقاطع صوتية فريدة وأصلية لا تخضع لحقوق الملكية الفكرية التقليدية، لاستخدامها كخلفيات موسيقية جذابة للفيديوهات القصيرة والقصص اليومية التي يشاركونها مع متابعيهم.
تحويل النصوص المكتوبة إلى مقطوعات موسيقية
تتيح الإمكانيات القوية والفريدة لنموذج تحويل النص إلى موسيقى لمستخدمي تطبيق جيميني ابتكار أغان ومقاطع من خلال وصف أنواع موسيقية دقيقة، أو تحديد حالات مزاجية معينة، أو حتى استحضار ذكريات شخصية حميمة ومحددة. على سبيل المثال العملي، يمكن للمستخدم إدخال أمر نصي بسيط يطلب فيه من التطبيق: «صمم لي مقطوعة من موسيقى أفروبيت مخصصة لوالدتي تعبر عن الأوقات العظيمة والجميلة التي قضيناها معا أثناء نشأتي». ولا يقتصر هذا المولد الموسيقي الذكي على تأليف وإنتاج مقاطع صوتية تعتمد على الآلات الموسيقية فقط، بل يتجاوز ذلك ليقدم تجربة متكاملة تشمل الأداء الصوتي، حيث يمكنه تأليف أغان متكاملة تتضمن كلمات مبتكرة يتم غناؤها بشكل تلقائي بناء على طبيعة التوجيهات التي أدخلها المستخدم.
دمج الصور والفيديوهات في الإبداع الموسيقي
إلى جانب الأوامر النصية المباشرة والمفصلة، حرصت جوجل على تزويد الأداة بإمكانيات الذكاء الاصطناعي متعدد الوسائط لإثراء التجربة الإبداعية. حيث يمكن للمستخدمين أيضا تحميل الصور الفوتوغرافية الثابتة والمقاطع المرئية القصيرة كمرجع بصري، ليقوم تطبيق جيميني بتحليل الألوان والحركة والمشاهد والعناصر الموجودة فيها بذكاء ودقة. وبناء على هذا التحليل البصري المعقد، يتم توليد مسار صوتي متناسق يتناسب تماما مع الأجواء العاطفية التي يعكسها هذا المحتوى البصري. كما يستطيع النظام صياغة وتوليد كلمات تتوافق مع الأجواء المرئية المبهرة، مما يوفر تجربة دمج حسية مدهشة تفتح آفاقا لا حصر لها لصناع الفيديو والفنانين البصريين لإضافة لمسة صوتية سحرية لأعمالهم.
الانتشار العالمي واللغات المتوفرة للاستخدام
في إطار سعيها لجعل هذه الأداة المبتكرة في متناول جمهور واسع ومتنوع حول العالم، أعلنت شركة جوجل أن أداة صنع الموسيقى الجديدة أصبحت متاحة للمستخدمين على مستوى عالمي انطلاقا من اليوم. وتدعم الميزة في انطلاقتها التجريبية الحالية مجموعة متنوعة من اللغات العالمية لتلقي الأوامر، وتشمل اللغة الإنجليزية، والألمانية، والإسبانية، والفرنسية، والهندية، واليابانية، والكورية، والبرتغالية، مع وجود خطط مؤكدة ومدروسة لتوسيع هذا الدعم ليشمل لغات إضافية في المستقبل القريب لتلبية احتياجات مستخدمين من مناطق جغرافية أوسع. ولضمان الاستخدام الآمن والمسؤول لهذه التقنيات التوليدية المتقدمة، قررت الشركة تقييد الوصول إلى هذه الأداة وحصر استخدامها فقط على مستخدمي تطبيق جيميني البالغين الذين تبلغ أعمارهم 18 عاما أو أكثر.
مستقبل الإبداع والتطوير الصوتي المتقدم
يشير إطلاق هذه الأداة المتطورة والمتاحة للجمهور إلى بدء حقبة جديدة ومثيرة في العلاقة التفاعلية بين الإنسان والآلة في مجال الفنون والموسيقى. فبينما يخشى البعض من أن تحل هذه الأدوات السريعة والفعالة محل الموسيقيين التقليديين، يرى الخبراء والمطورون في مختبرات ديب مايند التابعة لشركة جوجل أن الهدف الحقيقي من هذه المقطوعات والأدوات الذكية هو إلهام المبدعين وتزويدهم بنقطة انطلاق قوية ومبتكرة لتحفيز أفكارهم الفنية وتوسيع آفاقهم الإبداعية. إن هذه التقنية ليست بديلا عن الإبداع البشري، بل هي أداة مساعدة قوية تمكن الأفراد العاديين من التعبير عن أنفسهم بطرق كانت في السابق تتطلب سنوات من التعلم والممارسة في المعاهد الموسيقية المتخصصة.
أسئلة شائعة
السؤال: ما هي الميزة الفنية الجديدة التي تمت إضافتها إلى تطبيق جيميني؟
الإجابة: تمت إضافة أداة تتيح للمستخدمين توليد مقطوعات موسيقية وأغان أصلية مدتها 30 ثانية باستخدام الذكاء الاصطناعي.
السؤال: ما هو النموذج الصوتي الذي تعتمد عليه جوجل في هذه الأداة؟
الإجابة: تعتمد الأداة على نموذج صوتي متطور يُدعى ليريا 3، والذي تم تصميمه وتطويره بواسطة مختبرات ديب مايند التابعة للشركة.
السؤال: هل يمكن للذكاء الاصطناعي إنشاء أغان تحتوي على كلمات وغناء؟
الإجابة: نعم، يمكن للمولد الموسيقي إنشاء مقاطع موسيقية آلية بحتة بالإضافة إلى تأليف كلمات أغان وأدائها بصوت افتراضي متناغم.
السؤال: ما هي اللغات المدعومة حاليا وهل هناك أي قيود عمرية للاستخدام؟
الإجابة: تدعم الأداة 8 لغات رئيسية منها الإنجليزية والفرنسية والإسبانية، ويقتصر استخدامها على المستخدمين البالغين الذين تبلغ أعمارهم 18 عاما فأكثر.