كيف تعيد تقنية “التقطير” رسم مشهد الذكاء الاصطناعي؟ - غاية التعليمية
غاية التعليمية يكتُب.. في عالم يشهد تسارعًا محمومًا في سباق تطوير الذكاء الاصطناعي، يبرز سؤال أساسي يشغل أذهان الكثيرين، وهو: كم تبلغ تكلفة تأسيس شركة متخصصة في الذكاء الاصطناعي؟ الإجابة ليست رقمًا ثابتًا، بل واقع ديناميكي يتغير يومًا بعد يوم، ويعود ذلك إلى عدة عوامل رئيسية، أبرزها: انخفاض تكاليف الحوسبة، وظهور تقنيات مبتكرة مثل (التقطير) Distillation، التي أصبحت حديث الساعة، والتي سهلت بناء نماذج لغوية كبيرة بجودة عالية وبتكاليف قليلة.
اخر الاخبار العاجلة عبر غاية التعليمية أخبار محلية ودولية، وكذلك أخبار الر ياضة وخاصة كرة القدم يلا كورة و يلا شوت اليوم.
ومع ذلك تقنية (التقطير) ليست ابتكارًا جديدًا، ولكنها اكتسبت أهمية استثنائية في سباق الذكاء الاصطناعي، فقد أصبحت بمنزلة ثورة في مجال تطوير النماذج اللغوية، إذ تسمح هذه التقنية بإنشاء نماذج لغوية كبيرة عالية الجودة بتكلفة أقل، مما يفتح الباب أمام الشركات الناشئة والمطورين المستقلين للمنافسة في سوق كان حكرًا على الشركات العملاقة. ولكن، هل هذا التطور يمثل فرصة ذهبية للجميع، أم أنه يحمل في طياته مخاطر وتحديات جديدة؟
لذلك سنغوص في هذا المقال، في تفاصيل تقنية (التقطير)، لنكتشف كيف تغير قواعد اللعبة في عالم الذكاء الاصطناعي، وما الآثار المترتبة على هذا التطور، سواء على الشركات الناشئة، أو الشركات العملاقة، أو مستقبل الذكاء الاصطناعي ككل؟
تقنية التقطير.. مفهوم قديم بتطبيقات حديثة:
يكمن جوهر تقنية التقطير في استخلاص المعرفة من نموذج ذكاء اصطناعي ضخم لتطوير نموذج أصغر يتمتع بقدرات مشابهة ولكن بتكلفة أقل.
ففي هذه العملية، يُستخدم نموذج كبير الحجم، يتميز بقدرات متقدمة في توليد الاستجابات وتحديد مسارات التفكير – يمكن تشبيه بالمُعلِّم – لتدريب نموذج أصغر حجمًا وأقل تعقيدًا – يمكن تشبيه بالطالب – على محاكاة سلوك النموذج الأكبر، إذ يتعلم النموذج الأصغر كيفية توليد استجابات مماثلة واتباع مسارات التفكير نفسها التي يتبعها النموذج الأكبر. ويقلل هذا النهج من الحاجة إلى موارد حوسبة ضخمة، مما يجعل تطوير الذكاء الاصطناعي أكثر كفاءة واقتصادية.
أمثلة على قوة تقنية التقطير:
أثارت شركة الذكاء الاصطناعي الصينية الناشئة (DeepSeek) ضجة كبيرة في هذا المجال من خلال تطوير نماذج تنافس نماذج (OpenAI) بتكلفة تدريب تقدر بنحو 5 ملايين دولار فقط، وقد تسبب هذا الإنجاز في ظهور حالة من الذعر في سوق الأسهم، وتسبب في خسارة شركة إنفيديا لما يصل إلى 600 مليار دولار من قيمتها السوقية مؤقتًا، بسبب المخاوف من انخفاض الطلب على الرقاقات الإلكترونية، وهو انخفاض لم يتحقق بعد.
وعلى صعيد آخر، نجح فريق من جامعة (كاليفورنيا – بيركلي)، في تدريب نموذجين جديدين بتكلفة تبلغ أقل من 1000 دولار، وفقًا لبحث نُشر في شهر يناير الماضي، وفي مطلع فبراير، نجح باحثون من جامعات ستانفورد وواشنطن ومعهد ألين للذكاء الاصطناعي في تدريب نموذج تفكير عملي بتكلفة أقل بكثير، كما ورد في ورقة بحثية، وقد كانت تقنية التقطير هي العامل المشترك في تحقيق هذه الإنجازات.
دور تقنية التقطير في خفض التكاليف:
تُعدّ تقنية التقطير أداة حيوية للمطورين، إذ يستخدمونها مع تقنية الضبط الدقيق، لتحسين أداء النماذج خلال مرحلة التدريب، ولكن بتكلفة أقل بكثير مقارنة بالطرق التقليدية.
ويستخدم المطورون هاتين التقنيتين بنحو متكامل لتزويد النماذج بخبرات ومهارات محددة، مما يسمح بإنشاء نماذج متخصصة وفعالة بتكلفة معقولة، فعلى سبيل المثال، يمكن استخدام نموذج عام مثل نموذج (Llama) من ميتا وتقطيره باستخدام نموذج آخر ليصبح خبيرًا في قانون الضرائب الأمريكي.
كما يمكن استخدام نموذج الاستدلال (DeepSeek-R1) لتقطير نموذج (Llama) لتعزيز قدراته الاستدلالية، مما يسمح للنموذج بتوليد إجابات أكثر تفصيلًا وشرح عملية الوصول إليها خطوة بخطوة.
وقد سلطت شركة (SemiAnalysis) في تحليل نشرته في شهر يناير، الضوء على الإمكانات الثورية التي تحملها تقنية (التقطير) في مجال الذكاء الاصطناعي، إذ أكد المحللون أن الجزء الأكثر إثارة للاهتمام في ورقة نموذج (R1)، هو القدرة على تحويل النماذج الصغيرة غير الاستدلالية إلى نماذج استدلالية من خلال ضبطها بدقة باستخدام مخرجات نموذج استدلالي، ويعني ذلك أن تقنية التقطير لا تقتصر على تقليل حجم النماذج فحسب، بل يمكنها أيضًا تحسين قدراتها الاستدلالية.
وبالإضافة إلى التكلفة المنخفضة، التي تُعدّ ميزة كبيرة في مجال الذكاء الاصطناعي، أصدرت شركة (DeepSeek) نسخ مقطرة من نماذج مفتوحة المصدر أخرى، باستخدام نموذج الاستدلال R1 كنموذج مُعلِّم.
وتُعدّ نماذج (DeepSeek) الكاملة الحجم، بالإضافة إلى أكبر إصدارات (Llama)، نماذج ضخمة جدًا بحيث لا يمكن تشغيلها إلا في أجهزة متخصصة، وهنا يأتي دور التقطير في حل هذه المشكلة، إذ يتيح إنشاء نماذج أصغر حجمًا وأكثر قابلية للتشغيل في الأجهزة العادية، بما يشمل: الأجهزة المحمولة وأجهزة الحافة.
ومن ثم؛ فقد تمثل الإنجاز الأهم لشركة DeepSeek في اكتشاف أن النماذج المقطرة لم تفقد جودتها مع تصغير حجمها، بل على العكس، فقد تحسن أدائها. ويمثل ذلك نقلة نوعية في مجال تقنية التقطير، إذ يثبت أنه يمكن إنشاء نماذج ذكاء اصطناعي أصغر حجمًا وأكثر كفاءة دون التضحية بالجودة.
تاريخ تقنية التقطير وتطورها:
تعود جذور تقنية (التقطير) إلى ورقة بحثية نُشرت عام 2015، بتوقيع رواد الذكاء الاصطناعي البارزين في جوجل، جيف دين وجيفري هينتون، بالإضافة إلى أوريول فينيالز، نائب رئيس أبحاث (DeepMind) في جوجل. ومع ذلك، فقد كشف فينيالز حديثًا أن الورقة رُفضت من مؤتمر (NeurIPS) المرموق آنذاك، بسبب عدم تقدير تأثيرها المحتمل في المجال.
ولكن اليوم، بعد مرور عقد من الزمن، أصبحت تقنية التقطير في قلب النقاشات الدائرة حول مستقبل الذكاء الاصطناعي.
ويكمن السبب الرئيسي وراء القوة المتزايدة لتقنية التقطير في الوقت الحالي في وفرة وجودة النماذج المفتوحة المصدر التي يمكن استخدامها كنماذج مُعلِّمة. وقد أكدت كيت سول، مديرة الإدارة التقنية لـ LLM) Granite) التابع لشركة IBM، في بودكاست (Mixture of Experts) أن إطلاق شركة (DeepSeek) لنموذج ذي قدرات عالية جدًا، وهو النموذج المفتوح المصدر الأكثر قدرة حتى الآن، بموجب ترخيص MIT، قد أدى إلى تقويض الحواجز التنافسية التي حافظت عليها الشركات الكبرى بإبقاء نماذجها مغلقة.
ويعني ذلك أن إتاحة النماذج القوية المفتوحة المصدر تتيح للمطورين استخدامها لتقطير نماذج أصغر وأكثر كفاءة، مما يقلل من الفجوة بين الشركات الكبرى والشركات الناشئة والمطورين المستقلين.
مزايا وعيوب تقنية التقطير:
تزخر منصات مثل (Hugging Face)، وهي مستودع للنماذج اللغوية الكبيرة، بإصدارات مقطرة من نماذج مفتوحة المصدر شهيرة مثل: (Llama)من شركة ميتا، و(Qwen) من شركة (علي بابا) الصينية.
وتؤكد الإحصائيات هذا التوجه، فمن بين 1.5 مليون نموذج متوفر في منصة (Hugging Face)، يحمل ما يصل إلى 30 ألف نموذج كلمة (تقطير) في الاسم، مما يشير إلى طبيعتها المقطرة. ومع ذلك، تجدر الإشارة إلى أن هذه النماذج المقطرة لم تتمكن حتى الآن من الوصول إلى قائمة أكثر النماذج شعبية في المنصة.
وتُشبه (كيت سول) عملية التقطير بالتسوق في متاجر السلع الرخيصة، إذ تقدم أفضل قيمة مقابل التكلفة، ولكن مع محدودية في الاختيار وبعض العيوب، فتقنية التقطير قد تؤدي إلى تخصص النموذج في مهمة واحدة على حساب أدائه في مهام أخرى.
وقد حاول باحثو آبل تطوير (قانون لقياس التقطير) distillation scaling law، يتيح التنبؤ بأداء نموذج ذكاء اصطناعي مقطر، وذلك بناءً على عوامل مثل: حجم النموذج قيد الإنشاء، وحجم نموذج (المُعلِّم)، وقوة الحوسبة المستخدمة، وتوصلوا إلى أن التقطير قد يتفوق على التعلم الخاضع للإشراف التقليدي في بعض الحالات، ولكن بشرط استخدام نموذج عالي الجودة وأكبر من النموذج الذي يجري تدريبه، مع مراعاة وجود حد أقصى لحجم النموذج الكبير الذي سيستخدم كمُعلِّم للنموذج الأصغر.
ومع ذلك، تظل تقنية التقطير أداة قيمة لتقليل الفجوة بين الأفكار والنماذج الأولية، وتقليل حاجز الدخول إلى مجال تطوير الذكاء الاصطناعي. ويرى خبراء الذكاء الاصطناعي أن هذه التقنية لا تلغي الحاجة إلى النماذج الأساسية الكبيرة والمكلفة، ولكنها تثير تساؤلات حول الجدوى الاقتصادية للشركات التي تستثمر في بناء هذه النماذج الضخمة.
إستراتيجيات الشركات الكبرى في مواجهة تقنية التقطير:
أكد جنسن هوانج، الرئيس التنفيذي لشركة إنفيديا، في تصريح لشبكة CNBC بعد إعلان أحدث أرباح الشركة الفصلية، أن نموذج (DeepSeek R1) يستخدمه كل مطور ذكاء اصطناعي تقريبًا في العالم اليوم لتقطير نماذج جديدة، ويمثل هذا الانتشار الواسع لتقنية التقطير فرصة ضخمة لتطوير نماذج ذكاء اصطناعي أكثر كفاءة وبتكلفة أقل.
ومع ذلك، فإن هذه التقنية تواجه معارضة متزايدة بسبب التهديد الذي تشكله للنماذج الضخمة والمكلفة والخاصة، مثل تلك التي تنتجها شركات رائدة مثل: OpenAI و Anthropic.
ويرى جاسبر تشانج، أحد مؤسسي منصة Hyperbolic، أن النماذج التأسيسية (Foundation models) ستتحول تدريجيًا إلى سلع أساسية، مشيرًا إلى أن هناك حدًا للقدرات التي يمكن تحقيقها من خلال النماذج المدربة سابقًا، وأننا نقترب من هذا الحد.
ويقترح تشانج أن الحل الأمثل للشركات الكبرى في مجال النماذج اللغوية الكبيرة هو التركيز في بناء منتجات تحظى بشعبية واسعة بدلًا من التركيز في تطوير النماذج فقط، ويتماشى هذا الرأي مع قرار شركة ميتا بجعل نماذج Llama الخاصة بها مفتوحة المصدر جزئيًا.
بالإضافة إلى ذلك، أشار بعض الخبراء إلى وجود تكتيكات أكثر عدوانية يمكن أن تتخذها الشركات لمواجهة التحديات التي تفرضها تقنية التقطير، وتشمل هذه التكتيكات اتخاذ إجراءات قانونية أو تقنية لتقييد استخدام تقنية التقطير.
فعلى سبيل المثال: يمكن للشركات التي تمتلك نماذج استدلالية أن تحذف أو تقلل من خطوات الاستدلال أو آثار التفكير التي تظهر للمستخدم، لمنع استخدامها في عملية التقطير، وتجدر الإشارة إلى أن شركة (OpenAI) تخفي مسار الاستدلال الكامل في نموذج (o1)، ولكنها أطلقت لاحقًا نسخة أصغر تُسمى (o3-mini) تعرض هذه المعلومات.
وقد صرح ديفيد ساكس، مستشار الرئيس ترامب في مجال العملات المشفرة وسياسات الذكاء الاصطناعي، في شهر يناير الماضي، قائلًا: “سنشهد خلال الأشهر القادمة محاولات من شركات الذكاء الاصطناعي الرائدة لعرقلة عمليات التقطير”.
ومع ذلك، قد يكون من الصعب احتواء انتشار التقطير في ظل بيئة الذكاء الاصطناعي المفتوح المصدر التي تتسم بالفوضى.
وهذا ما أكدته (كيت سول) قائلة: “بإمكان أي شخص الدخول إلى منصة (Hugging Face)، والعثور على كميات ضخمة من البيانات المولدة باستخدام نماذج GPT، وقد نُسقت هذه البيانات ونُظمت خصوصًا لأغراض التدريب، وغالبًا ما يجري الحصول عليها دون الحصول على التراخيص اللازمة”. وأكدت أن هذه الممارسة، التي تُعدّ سرًا مكشوفًا، مستمرة منذ مدة طويلة.
ثورة مستمرة:
التقطير ليس مجرد أداة تقنية، بل ثورة تُعيد تعريف تكلفة وإمكانية الوصول إلى الذكاء الاصطناعي، وسواء استمرت في تهديد الشركات الكبيرة أو دفعت الابتكار لآفاق جديدة، فإنها تعيد تشكيل مستقبل الصناعة، إذ ستسمح هذه التقنية بإنشاء نماذج ذكاء اصطناعي أكثر كفاءة وتخصيصًا، وستفتح المجال أمام المزيد من الشركات والمطورين للمشاركة في هذه الصناعة.
كُنا قد تحدثنا في خبر كيف تعيد تقنية “التقطير” رسم مشهد الذكاء الاصطناعي؟ - غاية التعليمية بأستفاضة، ويمكنك تصفح جميع الأخبار المتعلقة بهذا الشأن عبر موقعنا غاية التعليمية الالكتروني.
0 تعليق