تقييم دقة التطبيقات الذكية في الأخبار

2025-02-11 18:26:27 (اخر تعديل 2025-02-11 18:26:27 )

ملخص الدراسة

تُظهر الدراسات أن تطبيقات الذكاء الاصطناعي مثل Gemini وChatGPT تواجه صعوبات كبيرة في تقديم ملخصات دقيقة للأخبار. حيث تم تقييم أكثر من نصف الملخصات التي قدمها صحفيون بأنها تحتوي على "مشاكل كبيرة". هذه النتائج تثير القلق حول دقة المعلومات التي تقدمها هذه التطبيقات.

مشاكل دقة المعلومات

تشمل الأخطاء التي تم اكتشافها في الملخصات معلومات غير صحيحة حول التوصيات الصحية، والأحداث العالمية، بالإضافة إلى التصريحات الكاذبة حول الأشخاص في المناصب العامة. وقد تم إجراء دراسة بواسطة BBC حيث تم إدخال محتوى من 100 قصة إخبارية في عدد من تطبيقات الذكاء الاصطناعي لتقييم دقتها.
ست شباب الحلقة 13

نتائج الدراسة

تُظهر النتائج أن حوالي 51% من إجابات الذكاء الاصطناعي تم تصنيفها على أنها تحتوي على "مشاكل كبيرة". وقد تضمنت بعض الملخصات معلومات خاطئة بالكامل، مثل:

أكد Gemini بشكل خاطئ أن NHS لا توصي بالتدخين الإلكتروني كوسيلة للإقلاع عن التدخين.
ذكرت ChatGPT وCopilot أن Rishi Sunak وNicola Sturgeon لا يزالان في المنصب رغم مغادرتهما.
أخطأ Perplexity في اقتباس BBC News حول الشرق الأوسط، حيث قال إن إيران أظهرت "ضبط نفس" واعتبرت أن تصرفات إسرائيل "عدوانية".

تحليل النتائج

تشير BBC إلى أن Copilot وGemini كان لديهما "مشاكل أكبر" من ChatGPT أو Perplexity، على الرغم من أن هذه التطبيقات عادة ما تمنع الوصول إلى محتواها. ومع ذلك، تم السماح بالوصول خلال هذه الاختبارات التي أجريت في ديسمبر.

نتيجة غير مفاجئة

إذا كنت تتابع تطورات الذكاء الاصطناعي على مدار السنوات الماضية، فإن هذه النتائج لن تكون مفاجئة. على الرغم من الاستثمارات الضخمة في تطوير هذه التكنولوجيا، لا تزال التطبيقات مثل Gemini وChatGPT غير موثوقة في العديد من الاستخدامات. جميع التطبيقات تشدد على ضرورة التحقق من دقة النتائج.

التحديات المستقبلية

على سبيل المثال، في يناير، أوقفت Apple ميزة جديدة على نظام iOS كانت تهدف إلى تلخيص الأخبار بعد أن وجد المستخدمون نتائج مشابهة لدراسة BBC. كما أن ميزة جديدة من Google TV ستعتمد على تلخيص الأخبار بواسطة الذكاء الاصطناعي، لكن مع وجود إشراف بشري. يبدو أن هذا هو الاتجاه الصحيح، لكن يتبادر إلى الذهن: إذا كان هناك شخص يقوم بتقييم دقة ملخص تم إنشاؤه بواسطة الذكاء الاصطناعي، فلماذا لا يكتب الإنسان الملخص بنفسه من البداية؟