تكنولوجيا

نموذج DeepSeek.. كل ما تريد معرفته عن الأداة الصينية المنافسة لـChatGPT

نموذج DeepSeek.. كل ما تريد معرفته عن الأداة الصينية المنافسة لـChatGPT هذا هو موضوع مقالنا عبر موقعكم «المفيد نيوز»، حيث نجيبكم فيه على كافة الاسئلة، ونلقي الضوء على كل ما يهمكم في هذا الموضوع ..فتابعو السطور القادمة بمزيد من الاهتمام.

أصدر مختبر الذكاء الاصطناعي الصيني DeepSeek عائلة نماذج R1 الجديدة بموجب ترخيص مفتوح من معهد ماساتشوستس للتكنولوجيا، مع أكبر إصدار يحتوي على 671 مليار معلمة، وتدعي الشركة أن النموذج يعمل بمستويات مماثلة لنموذج المحاكاة المنطقية (SR) الخاص بـ OpenAI o1، النموذج خلف روبوت الدردشة ChatGPT. ، في العديد من معايير الرياضيات والترميز.

إلى جانب إصدار النموذجين الرئيسيين DeepSeek-R1-Zero وDeepSeek-R1، نشرت DeepSeek ستة إصدارات أصغر من “DeepSeek-R1-Distill” تتراوح من 1.5 مليار إلى 70 مليار معلمة.

تعتمد هذه النماذج على بنيات موجودة مفتوحة المصدر مثل Qwen وLlama، ويتم تدريبها باستخدام البيانات التي تم إنشاؤها بواسطة نموذج R1 الكامل.

يمكن تشغيل الإصدار الأصغر على جهاز كمبيوتر محمول، بينما يتطلب النموذج الكامل موارد حاسوبية أكبر بكثير.

قال سيمون ويليسون، الباحث المستقل في مجال الذكاء الاصطناعي، لآرس في رسالة نصية: “إن تشغيلها ممتع للغاية، ومشاهدتها وهي تفكر أمر مضحك”.

اختبر ويليسون أحد النماذج الأصغر ووصف تجربته في منشور على مدونته: “تبدأ كل استجابة بعلامة تحتوي على سلسلة من الأفكار المستخدمة للمساعدة في توليد الاستجابة”، مشيرًا إلى أنه حتى بالنسبة للمطالبات البسيطة، ينتج النموذج مكثفًا التفكير الداخلي قبل الإخراج.

تقليد المنطق في العمل

يعمل نموذج R1 بشكل مختلف عن نماذج اللغات الكبيرة النموذجية (LLMs) من خلال دمج ما يسميه الأشخاص في الصناعة نهج الاستدلال.

إنهم يحاولون محاكاة سلسلة من الأفكار الشبيهة بالإنسان بينما يعمل النموذج من خلال حل لاستعلام.

ظهرت هذه الفئة مما يمكن أن نسميه “نماذج الاستدلال المحاكية”، أو نماذج SR باختصار، عندما أطلقت شركة OpenAI عائلة نماذج o1 في سبتمبر 2024.

أعلنت OpenAI عن ترقية رئيسية تسمى “o3” في ديسمبر، وعلى عكس نماذج LLM التقليدية، تستغرق نماذج SR هذه وقتًا إضافيًا لإنتاج الاستجابات، وهذا الوقت الإضافي غالبًا ما يؤدي إلى زيادة الأداء في المهام التي تتضمن الرياضيات والفيزياء والعلوم.

أحدث نموذج مفتوح يثير الاهتمام بسبب اللحاق السريع لـ OpenAI. على سبيل المثال، ذكرت DeepSeek أن R1 تفوق على OpenAI o1 في العديد من المعايير والاختبارات، بما في ذلك AIME (اختبار الاستدلال الرياضي)، وMATH-500 (مجموعة من المسائل اللفظية)، وSWE-bench Verified (أداة تقييم البرمجة).

يجب التعامل مع معلمات الذكاء الاصطناعي بحذر، ولم يتم التحقق من هذه النتائج بشكل مستقل بعد.

تفيد تقارير echCrunch أن ثلاثة مختبرات صينية، DeepSeek وAlibaba وKimi من Moonshot AI، قد أصدرت الآن نماذج يقولون إنها تتوافق مع قدرات O1، مع قيام DeepSeek بمعاينة R1 لأول مرة في نوفمبر.

لكن النموذج الجديد لـ DeepSeek يأتي مع مشكلة إذا تم تشغيله في النسخة السحابية: نظرًا لكونه صيني الأصل، فإن R1 لن يولد ردودًا حول موضوعات معينة مثل استقلال تايوان، لأنه يجب أن “يجسد القيم الاشتراكية الأساسية”، وفقًا للإنترنت الصيني. أنظمة.

يأتي هذا الترشيح من طبقة تعديل إضافية لن تشكل مشكلة إذا تم تشغيل النموذج محليًا خارج الصين، وحتى مع وجود رقابة محتملة، كتب دين بول، الباحث في الذكاء الاصطناعي بجامعة جورج ماسون، “هذا يعني أن مؤسسات الفكر والرأي سيستمر انتشاره على نطاق واسع ويمكن تشغيله على الأجهزة المحلية، بعيدًا عن أنظار أي نظام تحكم من أعلى إلى أسفل.

  • أقسام تهمك:
  • عيادات المفيد ..للحصول على معلومات صحية موثوقة 
  • سيارات المفيد.. تحديث على مدار الساعة في عالم السيارات
  • أخبار الاقتصاد والبنوك وعالم المال والأعمال..لا تفوته
  • الإسلام المفيد .. للفتاوى والقضايا الشائكة ..هام
  • للمزيد : تابعنا هنا ، وللتواصل الاجتماعي تابعنا علي فيسبوك وتويتر .

    مقالات ذات صلة

    اترك تعليقاً

    لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

    زر الذهاب إلى الأعلى