كشفت جوجل عن Gemini Omni، نموذج متعدد الوسائط يفهم النصوص والصور والصوت والفيديو لتوليد مقاطع الفيديو وتحريرها عبر المحادثة. يبدأ الطرح مع Omni Flash، ما يشير إلى توسع جوجل في أدوات الذكاء الاصطناعي الإبداعية سهلة الاستخدام.
الذكاء الاصطناعي
الذكاء الاصطناعي
Runway تراهن على الفيديو لمنافسة جوجل في الذكاء الاصطناعي
تراهن شركة Runway الناشئة في توليد الفيديو بالذكاء الاصطناعي على أن الفيديو سيكون الطريق نحو بناء نماذج عالمية أكثر تقدماً. وترى الشركة أن كونها لاعباً خارج منظومة عمالقة التقنية مثل جوجل قد يمنحها مرونة وميزة تنافسية.
الذكاء الاصطناعي
الذكاء الاصطناعي
نانو بانانا 2: نموذج ذكاء اصطناعي فائق السرعة لتوليد الصور
أطلقت شركة جوجل ديب مايند نموذج توليد الصور الجديد 'نانو بانانا 2'، الذي يجمع بين القدرات الاحترافية العالية والسرعة الفائقة في التوليد. يتميز النموذج بمعرفة عالمية متقدمة، وثبات في تمثيل المواضيع، وجاهزية إنتاجية عالية. ويُوصف أداؤه بأنه يعمل بسرعة 'فلاش'، ما يعزز كفاءته في التطبيقات العملية.
الذكاء الاصطناعي
الذكاء الاصطناعي
جيميني يطلق لييريا 3 لتوليد الموسيقى بالنصوص والصور
أطلقت جوجل ديب مايند نسخة مُحسَّنة من نموذج توليد الموسيقى لييريا 3 ضمن تطبيق جيميني. يمكّن النموذج المستخدمين من إنشاء مقاطع موسيقية مدتها 30 ثانية باستخدام النصوص أو الصور فقط. هذه الميزة تعزز إمكانات الذكاء الاصطناعي في الإبداع الصوتي وتوسع نطاق الوصول إلى أدوات التأليف الموسيقي.