Internet

اتفاق OpenAI لتدريب الذكاء الصناعي على بيانات Reddit

ماشي الشمال Wednesday, May 29 2024

وصلت OpenAI إلى اتفاق مع Reddit لاستخدام بيانات موقع الأخبار الاجتماعية لتدريب نماذج الذكاء الاصطناعي.

في تدوينة على موقع علاقات الصحافة الخاص بـ OpenAI ، قالت الشركة إن شراكة Reddit ستمنحها الوصول إلى "محتوى مهيكل وفريد في الوقت الحقيقي" - على سبيل المثال المشاركات والردود - من Reddit، مما يتيح لأدواتها ونماذجها "فهم وعرض" هذا المحتوى بشكل أفضل. سيتم دمج محتوى Reddit في ChatGPT ، الذكاء الاصطناعي الحواري الشهير لـ OpenAI ، وستعمل الشركتان معًا لتقديم ميزات "مدفوعة بالذكاء الاصطناعي" جديدة إلى مستخدمي Reddit والمشرفين على حد سواء.

ستصبح OpenAI أيضًا شريكًا للإعلان على Reddit.

"ستعمل Reddit على بناء منصة OpenAI لنماذج الذكاء الاصطناعي لتحقيق رؤيتها القوية،" كتبت OpenAI في التدوينة. "باستخدام LLMs و ML و AI، يمكن لـ Reddit تحسين تجربة المستخدم للجميع."

تمتلك OpenAI عدة صفقات ترخيص مماثلة مع موفري محتوى تتراوح بين مكتبات وسائط الأسهم إلى ناشري الأخبار. ولكن الزاوية غير المعتادة لهذا هو أن سام ألتمان، الرئيس التنفيذي لـ OpenAI، لديه حصة تبلغ 8.7٪ في Reddit، مما يجعله ثالث أكبر مساهم، وكان في وقت ما عضوًا في مجلس إدارة الشركة.

وفي محاولة للحد من الفحص، يقول OpenAI في بيانه الصحفي، إنه بينما يظل ألتمان مساهماً في Reddit، إلا أن الشراكة 'تمت بإشراف كبير من قبل المدير التشغيلي [براد ليتكاب]' و'تمت الموافقة عليها من قبل [مجلس إدارة OpenAI] المستقل'.

Reddit جعلت اتفاقات ترخيص البيانات جزءًا متزايد الأهمية من استراتيجيتها للنمو بينما تتنقل في السوق كشركة عامة.

في وثيقة الطرح العام الأولي الخاصة بها، كشفت Reddit أنها تملك اتفاقات تعاقدية لترخيص بياناتها لعملاء بما في ذلك Google بقيمة تزيد عن 200 مليون دولار. وفي أول تقرير عن الأرباح كشركة عامة، أفادت Reddit بزيادة بنسبة 450٪ عن العام السابق في الإيرادات غير الإعلانية، ترجع بشكل رئيسي إلى تلك الاتفاقات.

ارتفع سعر سهم Reddit بنسبة 11٪ في التداول الموسع بعد إعلان اتفاق OpenAI.

"التناقض الذي أراه هو أنه، مع كتابة المزيد من المحتوى على الإنترنت بواسطة الآلات، هناك زيادة في القيمة الحصرية للمحتوى الذي يأتي من الأشخاص الحقيقيين، " قال الرئيس التنفيذي لـ Reddit، ستيف هافمان، خلال مكالمة الأرباح الخاصة بالشركة في مارس. "ونحن لدينا ما يقرب من عقدين من الحوار الأصيل."

منصة Reddit - التي تحتوي على أكثر من مليار مشاركة وأكثر من 16 مليار تعليق، أرقام تنمو يوميًا بفضل مئات الملايين من المستخدمين النشطين - هي منجم ذهبي لشركات الذكاء الاصطناعي الإنشائي، الذين تعتمد نماذجهم على أمثلة من المحتوى، مثل النصوص والصور، لتوليد محتوى جديد مماثل.

ولكن يمكن أن تواجه الشركة مقاومة من المستخدمين الذين يشعرون بالقلق حيال كيفية استغلال بياناتهم.

فمن المفيد النظر في Stack Overflow ، منتدى الأسئلة والأجوبة لمطوري البرمجيات، الذي وقع مؤخرًا اتفاقًا مع OpenAI لتزويد البيانات لتدريب نماذج هذا الأخير. كمحتجة، حذف بعض المستخدمين إجاباتهم ذات التقييم العالي على الأسئلة في المجتمع. لكن Stack Overflow استعادت المشاركات المحذوفة وحظرت تلك المستخدمين، مدعية أنهم لم يكونوا متوافقين مع شروط الخدمة الخاصة بها.

عبر Reddit بالفعل عن عدم رضاها عن محاولة لمنح مستخدمي Reddit مزيدًا من السيطرة على بياناتهم الخاصة.

فـ Vana، شركة ناشئة مبنية على تقنية البلوكشين، تحاول إطلاق "DAO" (المنظمة الرقمية الذاتية) للسماح لمستخدمي Reddit بدمج بياناتهم والسماح لهم باتخاذ قرار مشترك بشأن كيفية استخدام هذه البيانات المجتمعة (أو بيعها). عمل Reddit على حظر subreddit الخاص بـ Vana المخصص للنقاش حول الـ DAO، في بيان لـ TechCrunch، واتهمت الشركة بـ "استغلال" ضوابط تصدير بياناتها.

نحن نطلق النشرة الإخبارية حول الذكاء الاصطناعي! اشترك هنا لبدء تلقيها في صناديق البريد الواردة في 5 يونيو.

ماشي الشمال