أطلقت شركة DeepSeek الصينية نموذج DeepSeek V3 الذكي، والذي أثبت تفوقاً كبيراً في منافسة العديد من النماذج الأخرى في مجالات مثل كتابة الأكواد البرمجية، وإنشاء النصوص.
أتاحت الشركة المطورة نموذجها الجديد لمختلف الاستخدامات، بما في ذلك الاستخدامات التجارية، من خلال حصول المطورين على تراخيص بالموافقة من جانبها.
مميزات نموذج DeepSeek V3
يتمكن نموذج DeepSeek V3 من إنجاز مهام مختلفة، مثل كتابة النصوص والترجمة الفورية وكتابة الأكواد البرمجية التي أثبت تفرده بها أمام نماذج رائدة مثل نموذج Llama 3.1 405B من ميتا، وGPT-4o من OpenAI، وكذلك نموذج شركة علي بابا الأحدث Qwen 2.5 72B، بحسب اختبارات منصة Cpdefprces للبرمجة الآلية.
وكذلك، نجح النموذج الصيني الجديد في تسجيل أرقام قياسية في اختبار Aider Polyglot، الذي يقيس العديد من قدرات النماذج الذكية، بما في ذلك القدرة على كتابة أكواد برمجية جديدة تتماشى مع الكود البرمجي الحالي.
تفوق نموذج DeepSeek V3 قد يكون متوقعاً، إذ أشارت شركته المطورة إلى أنه قد تم تدريبه على قاعدة بيانات مكونة من 12.8 تريليون توكن، والتوكن هي وحدة تمثيل حجم البيانات في صورتها النصية، ومليون توكن تساوي قرابة 750 ألف كلمة.
ويعتمد DeepSeek V3 على عدد ضخم من المتغيرات، إذ يتكون من 685 مليار متغير، بما يفوق حجم أكبر نموذج مفتوح المصدر لدى ميتا وحجمه 405 مليارات متغير، بقرابة 1.6 مرة.
يُذكر أن فكرة المتغير Parameter مرتبطة في نماذج الذكاء الاصطناعي بتنوع وحجم المهارات والقدرات الخاصة بتلك النماذج، فكلما كان عدد المتغيرات أكبر، كلما زاد تطور إمكانيات النماذج.
وأشارت شركة DeepSeek إلى أن نموذجها الأحدث قد تم تدريبه خلال شهرين فقط، باستخدام مجموعة من رقائق معالجات إنفيديا H800، وهي الرقائق التي تم حظر تصديرها إلى الصين مؤخراً بقرار من وزارة التجارة الأميركية، وبميزانية 5.5 مليون دولار، وهي ميزانية زهيدة لتدريب نماذج الذكاء الاصطناعي.
المرجع : https://asharq.co/p2yfb
{ إِنَّ اللَّهَ وَمَلَائِكَتَهُ يُصلُّونَ عَلَى النَّبِيِّ يَا أَيُّهَا الَّذينَ آمَنُوا صَلُّوا عَلَيْهِ وَسَلِّمُوا تسلِيماً } ﷺ
{ إِنَّ اللَّهَ وَمَلَائِكَتَهُ يُصلُّونَ عَلَى النَّبِيِّ يَا أَيُّهَا الَّذينَ آمَنُوا صَلُّوا عَلَيْهِ وَسَلِّمُوا تسلِيماً } ﷺ
0تعليقات