DeepGEMM: clean and efficient FP8 GEMM kernels with fine-grained scaling - Commits · deepseek-ai/DeepGEMM
DeepSeek تحدّث مشروع DeepGEMM لتسريع حسابات FP8
يعرض الخبر صفحة الالتزامات لمشروع DeepGEMM من DeepSeek، وهي مكتبة تركّز على نوى GEMM عالية الكفاءة بدقة FP8 مع تحجيم دقيق. يشير ذلك إلى استمرار العمل على تحسين أداء عمليات الضرب المصفوفي الأساسية في نماذج الذكاء الاصطناعي.
ملخص الذكاء الاصطناعي
- يعرض الخبر صفحة الالتزامات لمشروع DeepGEMM من DeepSeek، وهي مكتبة تركّز على نوى GEMM عالية الكفاءة بدقة FP8 مع تحجيم دقيق. يشير ذلك إلى استمرار العمل على تحسين أداء عمليات الضرب المصفوفي الأساسية في نماذج الذكاء الاصطناعي.
- تحسين نوى GEMM منخفضة الدقة قد يساهم في خفض تكلفة تشغيل وتدريب نماذج الذكاء الاصطناعي الكبيرة وزيادة كفاءتها على العتاد المتقدم.
- DeepGEMM: clean and efficient FP8 GEMM kernels with fine-grained scaling - Commits · deepseek-ai/DeepGEMM