تقنية جديدة لتحديد محتوى الذكاء الاصطناعي
أهم النقاط الرئيسية
- تساعد تقنية SynthID على تحديد المحتوى الذي تم إنشاؤه بواسطة Google Gemini ونماذج الذكاء الاصطناعي الأخرى.
- تعمل الأداة على تعديل التوقعات بشكل طفيف لتوقيع النص بناءً على الاختلافات الدقيقة بين المخرجات المتوقعة والفعلية.
- تشجيع DeepMind على استخدام SynthID بشكل مفتوح المصدر يعزز اعتماد الصناعة على أدوات تحديد محتوى الذكاء الاصطناعي.
تتبع الروبوتات
توقيع غير مرئي في كل مرة
شهدت الفترة الأخيرة زيادة ملحوظة في المحتوى الذي يُنسب خطأً إلى الكتاب البشريين، وخاصة بعد أن جعلت نماذج اللغة الكبيرة الحديثة اختبار تورينغ غير ذي صلة. بالإضافة إلى الأدوات المماثلة المستخدمة لتحديد الصور والأصوات والفيديوهات التي تم إنشاؤها بواسطة الذكاء الاصطناعي، أصدرت شركة DeepMind التابعة لجوجل النسخة التجريبية من تقنية SynthID، وهي وسيلة لتوقيع وتحديد النصوص التي يتم إنشاؤها باستخدام نموذج Gemini. والأفضل من ذلك، أنهم جعلوا الأداة مفتوحة المصدر، مما يتيح لشركات الذكاء الاصطناعي الأخرى استخدامها لمتابعة ما تنتجه نماذجها.
البراعم الحمراء الحلقة 24
تقدم تقنيات DeepMind السابقة القدرة على إضافة علامات مائية إلى الصور والفيديوهات والأصوات بطرق لا يمكن اكتشافها من قبل الإنسان. لكن SynthID تطورت لتوقيع النصوص التي تم إنشاؤها بواسطة نماذج اللغة الكبيرة. تعتمد هذه التقنية على تغيير طفيف في المخرجات الاحتمالية للنموذج، مما يؤدي إلى تعديل بسيط في الكلمات التي يُحتمل أن تكون الأنسب في مقطع نصي معين.
يعتمد النظام على الاختلاف بين المخرجات المتوقعة للنموذج وما ينتجه الخوارزم المعدل، مما يسمح بتحديد ما إذا كان المحتوى قد تم كتابته بواسطة Google Gemini. ومع ذلك، يجب أن يظل المحتوى دون تغيير، حيث أن أي تغيير كبير قد يؤثر سلبًا على قدرات اللغة الخام للنموذج.
الدفع نحو دعم الصناعة بشكل واسع
لا تتوقف DeepMind عند تصنيف مخرجات Google Gemini فقط. فقد تم بالفعل فتح مصادر تقنية SynthID وعرضها على مطوري نماذج الذكاء الاصطناعي الأخرى، لتشجيع استخدامها مع العديد من نماذج اللغة الكبيرة المنافسة في السوق.
مثل كل أداة لتحديد الذكاء الاصطناعي (وكذلك العديد من تقنيات كسر التشفير)، قد تمنح SynthID المطورين غير الأخلاقيين وسيلة جديدة لإخفاء أصول نصوصهم. لكن مشاركة DeepMind، التابعة لأحد أكبر الشركات في جمع البيانات، تعني أن هناك موارد كبيرة مخصصة لضمان إمكانية التعرف على محتوى الذكاء الاصطناعي بسهولة.