كشفت جوجل عن Gemini Omni، نموذج متعدد الوسائط يفهم النصوص والصور والصوت والفيديو لتوليد مقاطع الفيديو وتحريرها عبر المحادثة. يبدأ الطرح مع Omni Flash، ما يشير إلى توسع جوجل في أدوات الذكاء الاصطناعي الإبداعية سهلة الاستخدام.
الذكاء الاصطناعي
الذكاء الاصطناعي
جوجل ديب مايند تكشف عن Gemini Omni
أعلنت Google DeepMind عن Gemini Omni، في إشارة إلى توسع جديد ضمن عائلة نماذج Gemini للذكاء الاصطناعي. ورغم غياب تفاصيل المحتوى، يوحي الإعلان بتركيز على قدرات أكثر شمولاً وتكاملاً في النماذج متعددة الوسائط.
التكنولوجيا
التكنولوجيا
وايرستوك تجمع 23 مليون دولار لتغذية مختبرات الذكاء الاصطناعي
Wirestock، منصة إبداعية متعددة الوسائط، جمعت 23 مليون دولار لتوسيع قدرتها على تزويد مختبرات الذكاء الاصطناعي بمحتوى عالي الجودة من الصور والفيديوهات وعناصر الواقع ثلاثي الأبعاد. وتضم المنصة أكثر من 700 ألف مبدع عالمي، ما يعزز دورها كمصدر رئيسي للبيانات المُولَّدة بشرّيًا في سلسلة توريد نماذج الذكاء الاصطناعي. هذه الجولة التمويلية تعكس الطلب المتزايد على المحتوى المرخص والمتنوع لتدريب النماذج دون الاعتماد الكلي على البيانات المُجمعة تلقائيًا.
الذكاء الاصطناعي
الذكاء الاصطناعي
DeepSeek تطلق نموذج VL2 متعدد الوسائط
أعلنت DeepSeek عن مشروع DeepSeek-VL2، وهي نماذج رؤية ولغة متعددة الوسائط تعتمد بنية مزيج الخبراء لتحسين فهم الصور والنصوص. يعكس الإصدار توجهاً نحو نماذج أكثر كفاءة وتخصصاً في مهام الذكاء الاصطناعي متعددة الوسائط.