Google's Gemini Omni is a new multimodal model that reasons across text, images, audio, and video to generate and edit videos through simple conversation — starting with Omni Flash.
جوجل تطلق Gemini Omni لتوليد الفيديو بالمحادثة
كشفت جوجل عن Gemini Omni، نموذج متعدد الوسائط يفهم النصوص والصور والصوت والفيديو لتوليد مقاطع الفيديو وتحريرها عبر المحادثة. يبدأ الطرح مع Omni Flash، ما يشير إلى توسع جوجل في أدوات الذكاء الاصطناعي الإبداعية سهلة الاستخدام.
ملخص الذكاء الاصطناعي
- كشفت جوجل عن Gemini Omni، نموذج متعدد الوسائط يفهم النصوص والصور والصوت والفيديو لتوليد مقاطع الفيديو وتحريرها عبر المحادثة. يبدأ الطرح مع Omni Flash، ما يشير إلى توسع جوجل في أدوات الذكاء الاصطناعي الإبداعية سهلة الاستخدام.
- يمثل Gemini Omni خطوة مهمة نحو جعل إنتاج الفيديو بالذكاء الاصطناعي أكثر سهولة، وقد يزيد المنافسة في سوق أدوات الإبداع والتصميم المدعومة بالنماذج متعددة الوسائط.
- Google's Gemini Omni is a new multimodal model that reasons across text, images, audio, and video to generate and edit videos through simple conversation — starting with Omni Flash.