عاجل

يمكنك الآن الاطلاع على جميع الكتب Meta مقرصنة لتدريب الذكاء الاصطناعي - غاية التعليمية

0 تعليق ارسل طباعة

يمكنك الآن الاطلاع على جميع الكتب Meta مقرصنة لتدريب الذكاء الاصطناعي - غاية التعليمية

غاية التعليمية يكتُب.. يتم إساءة استخدام وصولنا إلى الأدب المجاني من طرفين ، على جانب واحد هو حكومة أمريكية تولدها من قبل القلة التقنية ، والجانب الآخر هو بعض القلة وشركات التكنولوجيا الكبرى الأخرى. لقد تلاشت الذكاء الاصطناعى من قبل شركات مثل Meta الملايين على ملايين الكتب من مواقع القرصنة. ولكن إذا كنت لا ترغب في قراءة القمامة التي تم إنشاؤها من الذكاء الاصطناعى ، فإن الحكومة الفيدرالية تحت قيادة الرئيس دونالد ترامب تتطلع إلى قتل أحد المصادر الرئيسية لتمويل المكتبات العامة. إنه وقت سيء إذا كنت تحب القراءة.

اخر الاخبار العاجلة عبر غاية التعليمية أخبار محلية ودولية، وكذلك أخبار الر ياضة وخاصة كرة القدم يلا كورة و يلا شوت اليوم.

على مدار العامين الماضيين ، كان المحيط الأطلسي يحلل وإنشاء مستودعات لبيانات البيانات المتاحة للجمهور المستخدمة لتدريب الذكاء الاصطناعي. وضع الموقع أنظاره على Libgen ، وهو أرشيف لوسائل الإعلام المقرصنة التي تضم ملايين الكتب والأوراق الأكاديمية والمقالات الأخرى. أصدر الموقع مؤخرًا نتائجه إلى جانب أداة للبحث من خلال أرشيف الملايين على ملايين الأعمال المقرصنة. مع ذلك ، يمكنك البحث عن المؤلفين المفضلين لديك للعثور على ما إذا كانت قد استخدمت لتدريب نماذج الذكاء الاصطناعى من أمثال Openai و Mistral و Meta.

Libgen ، الاسم المختصر لتكوين المكتبة ، هو ما يشار إليه عبر الإنترنت باعتباره “مكتبة الظل” لطبيعتها غير المشروعة ولكن المفتوحة. ويشمل ما يقرب من 7.5 مليون كتاب و 81 مليون ورقة أكاديمية ، وفقا لتقرير الأطلسي. في حين أنه يحتوي على مجموعة من المواد المحمية بحقوق الطبع والنشر ، فإن ذلك يكذب فوائده الفعلية للمجتمع. كما تم استخدام سفر التكوين المكتبة من قبل العلماء للوصول إلى الأعمال الأكاديمية دون دفع رسوم باهظة للناشرين. تم التعرف على مكتبات الظل الأخرى مثل Sci-Hub من قبل مجموعات مثل مؤسسة Frontier Electronic كهدف جيد لتقدم العلوم.

تواصل Gizmodo مع Meta للتعليق ، لكننا لم نسمع على الفور. كما طلبنا من Mistral و Openai التعليق على استخدامها لـ Libgen. في بيان لـ Gizmodo ، قال متحدث باسم Openai: “لم يتم تطوير النماذج التي تعمل على تشغيل ChatGPT و API اليوم باستخدام مجموعات البيانات هذه. لم يتم استخدام مجموعات البيانات هذه ، التي تم إنشاؤها من قبل الموظفين السابقين الذين لم يعودوا مع Openai ، في عام 2021”.

لكن في حين أن Libgen قد لا يكون في قلب عمل Openai الآن ، فإنه يوضح أيضًا أين تقف شركات AI وغيرها من شركات الذكاء الاصطناعى ويبدو أنها سفينة قرصنة. في العام الماضي ، قال أحد موظفي Openai السابق إنه شعر أن الشركة تحطم قانون حقوق الطبع والنشر ، على الرغم من أن Openai قد دافع عن نفسها في المحكمة بسبب دعاوى حقوق الطبع والنشر التي تدعي استخدام الأعمال المحمية بحقوق الطبع والنشر لتدريب الذكاء الاصطناعي. غطت مواقع مثل The Verge بالفعل خطط Meta لاستخدام Libgen في محاولة للتغلب على Openai و Mistral. أحدث سجلات المحكمة من دعوى جماعية يرأسها الممثل الكوميدي سارة سيلفرمان ، أذكر الباحثة الكبرى ميتا ، ميلاني كامبدور ، قائلاً إن ميتا ستحتاج إلى كتب “في أسرع وقت ممكن” لأن “الكتب هي في الواقع أكثر أهمية من بيانات الويب” لتدريب الذكاء الاصطناعي. تكشف المزيد من الوثائق عن أن موظفي الشركة قد فكروا في ترخيص كتب لتدريب الذكاء الاصطناعي ، لكنهم اختاروا أرشيفًا مقرصًا بدلاً من ذلك. قال أحد مديري الهندسة إذا كانوا يرخصون “كتابًا واحدًا” ، ولم تتمكن الشركة من استخدام الحجة القانونية “للاستخدام العادل”.

إذا كنت تتساءل عن مدى ارتفاع “الاقتراض” الوقح ، فإن وثيقة البريد الإلكتروني الأخرى تشير إلى “تصعيد إلى MZ” ، والتي يمكن أن تشير إلى الرئيس التنفيذي مارك زوكربيرج باعتباره القرار النهائي. يزعم الأطلسي كذلك أن Meta استخدم سيلًا لتنزيل Libgen ، والذي كان من شأنه أن يزرع الملفات لأشخاص آخرين في قانون حقوق الطبع والنشر المباشرة. من ناحية أخرى ، كان Meta أكثر من سعداء بالملاحظة في وقت سابق من هذا الأسبوع أن الأشخاص قاموا بتنزيل Llama AI Model 1 مليار مرة.

على الرغم من أن القانون لا يزال لم ينجح ما إذا كان منظمات الذكاء الاصطناعية للبيانات المحمية بحقوق الطبع والنشر قانونية ، فإنه واضح أين يقف المجتمع الإبداعي. قام مايكل تشابون بمقاضاة Meta لاستخدامه في عمله المحمي لتدريب الذكاء الاصطناعي. أحدث كشف الأطلسي لم يترك مؤلفون غير سعيدين للغاية. كتب المؤلف مايكل ليفينجستون على Bluesky ، وجد 16 من كتبه والمزيد من المقالات المستخدمة في تدريب Llama 3. قال المؤلف الحائز على جائزة Nebula Aliette de Bodard “جميع كتبي في Libgen ، وأنا لست سعيدًا بذلك”.

أصبحت مفارقة الكتب المتقدمة لتدريب الذكاء الاصطناعى أكثر صرامة حيث تعمل إدارة الرئيس دونالد ترامب على تدمير الجهاز الذي يدعم المكتبات العامة مالياً بينما يميل إلى الذكاء الاصطناعي للعديد من الخدمات التي يؤديها البشر تقليديًا. في 14 مارس ، أصدر ترامب أمرًا تنفيذيًا من شأنه أن يقتل فعليًا معهد المتاحف والمكتبة. كما يوحي اسمها ، تقدم الوكالة منحًا وتمويلًا آخر للمكتبات العامة في جميع أنحاء الولايات المتحدة يوم الخميس ، عين ترامب كيث إ. سوندرينج في منصب مدير التمثيل في IMLS.

عادة ما تساعد الضرائب الحكومية والمحلية في دفع تكاليف المكتبات ، ولكن العديد من المؤسسات في الولايات المتحدة تعتمد على تمويل المنح الفيدرالية للخدمات الأساسية. يمتد هذا إلى الخدمات الرقمية التي تروج لها المكتبات ، وهو ما يعطينا تطبيقات مثل Libby و Hoopla ، والتي تتيح للمستخدمين التحقق من الكتب الإلكترونية أو الكتب الصوتية من مكتباتهم المحلية. أخبر رئيس Hoopla Digital Jeff Jankowski NPR أنه بدون تمويل فيدرالي ، قد تتوسع بعض المكتبات أو تقتل خدماتها الرقمية. توقع أن تتوفر أوقات انتظار أطول حتى تتوفر الكتب الإلكترونية ، أو تجد أن كتابًا واحدًا كنت تأمل في قراءته غير متاح على الإطلاق.

يبدو أن Musk و Doge يعتقدون أن استبدال الموظفين الذين تم إطلاق النار عليهم بالمنظمة العفوية سيجعل الحكومة أكثر كفاءة. من المؤكد أن chatbots يمكنها إعادة إنتاج الاستجابات التكرارية بناءً على مطالبة ، ولكن من غير المرجح أن تتمكن الذكاء الاصطناعى من تحقيق أي مما يمكن أن تفعله الوكالة الفيدرالية عند التوظيف بالكامل. ستؤدي النتيجة عن كل هذا التدخل من قبل القلة التقنية إلى قمع وصولنا إلى الأدب ، أولاً من خلال إيذاء صناعة الكتب من خلال سرقة عمل المؤلفين ، ثم عن طريق الحد من وصول الناس إلى الكتب تمامًا.

كُنا قد تحدثنا في خبر يمكنك الآن الاطلاع على جميع الكتب Meta مقرصنة لتدريب الذكاء الاصطناعي - غاية التعليمية بأستفاضة، ويمكنك تصفح جميع الأخبار المتعلقة بهذا الشأن عبر موقعنا غاية التعليمية الالكتروني.

جميلة الهادي
إخترنا لك

أخبار ذات صلة

0 تعليق