ماذا بعد R1؟
مقدمة قبل عدة أيام نشرت شركة الذكاء الاصطناعي الصينية ديب سيك - Deepseek نموذجاً لغوياً اسمه R1 ( Citation: DeepSeek-AI, 2025 DeepSeek-AI (2025). DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning. Retrieved from https://arxiv.org/abs/2501.12948 ) ، ميزته هي قدرته على “التفكير” في المسألة قبل الإجابة، على شاكلة نموذج o1 من أوبن آي - OpenAI. تدريب الذكاء الاصطناعي على التفكير هو التوجه الجديد لتحسين هذه النماذج، والأمر أصعب مما يبدو، فالبيانات الموجودة لتدريب هذه النماذج نادراً ما تحوي على التبرير أو التفكير، والإنسان غالباً يفكّر في باطنه لا بلسانه أو على ورقة وقلم....