غوغل تطلق نماذج جميني الجديدة بقدرات متطورة
في الأسبوع الماضي، أطلقت شركة غوغل نموذجها الجديد جميني 2.0، وهو عائلة جديدة من نماذج الذكاء الاصطناعي التي تدعم روبوت الدردشة الخاص بالشركة بنفس الاسم. هذا النموذج يأتي مع ميزات جديدة تتيح له الوصول المباشر إلى المعلومات من خدمات مثل بحث غوغل، بالإضافة إلى قدرته على إنشاء الصور والمقاطع الصوتية بشكل أصلي لتضمينها في ردوده. تقول غوغل إن نماذج الذكاء الاصطناعي الحديثة مصممة لعصر جديد يتسم بالقدرة على الوصول إلى الإنترنت واستخدام الأدوات لإنجاز المهام بالنيابة عن المستخدمين.
اعتبارًا من هذا الأسبوع، أصبح بإمكان مشتركي جميني المتقدمين تجربة مجموعة من النماذج الجديدة: جميني 2.0 فلاش تجريبي، جميني 2.0 تجريبي متقدم، وجميني 1.5 برو مع بحث عميق. تنضم هذه الخيارات إلى النماذج الحالية مثل 1.5 برو القياسي (للمهام المعقدة) و1.5 فلاش (للمساعدة اليومية). من المنطقي أن يحصل المشتركون المدفوعون على فرصة تجربة الميزات الجديدة مبكرًا. ومع ذلك، بالنظر إلى أن المنتج يُفترض به أن يسهل بعض الأعمال المعقدة مثل البحث المتعمق، وكذلك المهام الأكثر تعقيدًا مثل حجز السفر، فإن استخدام جميني يصبح أكثر تعقيدًا وصعوبة في الفهم.
نموذج لكل مهمة
يتمتع مشتركو جميني المتقدمون الآن بخيار استخدام خمسة نماذج مختلفة من جميني. بالنظر إلى أن الأعمال الأكثر تعقيدًا تتطلب موارد أكبر، فإن استخدام نماذج مختلفة لمهام مختلفة يعد أمرًا منطقيًا. إذا كان بإمكان نموذج فلاش الأبسط أن يجيب على استفسار معين بنفس كفاءة نموذج برو الأكثر تعقيدًا، فسيكون من الأفضل استخدام فلاش لتوفير بعض الطاقة الحاسوبية، وهو أمر أصبح مصدر قلق متزايد في مجال الذكاء الاصطناعي.
لكن وجود قائمة منسدلة تسمح للمستخدمين باختيار نموذج معين لكل استفسار يبدو وكأنه وسيلة غير بديهية لإدارة قدرات جميني المتنوعة. يبدو أن التعرف على تفاصيل النماذج بأسماء مثل "جميني 2.0 فلاش" و"جميني 1.5 برو" يتطلب مجهودًا كبيرًا.
إمكانية البحث العميق
على سبيل المثال، يعد نموذج "جميني 1.5 برو مع بحث عميق" الوحيد من بين الخمسة الذي يمكنه تنفيذ وظيفة البحث العميق لـجميني، والتي تجمع المعلومات من عشرات أو حتى مئات المصادر لإنشاء تقارير مفصلة. بينما لا يزال نموذج "جميني 2.0 متقدم" الجديد، والذي يعتبر بشكل عام أفضل، غير قادر على ذلك. إذا طلبت منه ذلك، فسوف يقوم بذلك، ولكن لن يخبرك أن استفسارك سيكون أفضل لو تم استخدامه مع 1.5 برو مع بحث عميق.
هل يجب أن تسهل الذكاء الاصطناعي حياتنا؟
إن جاذبية واجهات الذكاء الاصطناعي الطبيعية تكمن في أنك لا تحتاج إلى معرفة كيفية عملها لاستخدامها. على عكس التطبيقات التقليدية، التي تتطلب منك تعلم تفاصيل واجهة المستخدم وأين تجد الوظائف المختلفة لإنجاز المهام المعقدة، مع شيء مثل جميني أو شات جي بي تي، لا يجب أن تحتاج إلى معرفة متخصصة - فقط استفسار مُشكل بشكل جيد. إن إدخال قائمة من النماذج المجردة للاختيار من بينها لكل إدخال يبدو متناقضًا مع إحدى أكثر الخصائص قيمة لهذا النوع من التطبيقات: سهولة الاستخدام.
توفير خيار الاختيار اليدوي للنموذج الذي ستستخدمه أمر منطقي للمشتركين المتقدمين، ولكنه لا ينبغي أن يكون شرطًا. لجعل جميني أسهل في الاستخدام، أود أن أرى إصدارًا مستقبليًا يحدد النموذج الأنسب لاستفسارك تلقائيًا، دون إشراف يدوي. كما هو الحال الآن، لا يخبرك جميني حتى إذا كنت قد استخدمت النموذج الخطأ لمهمة معينة. أليس من المفترض أن تسهل الذكاء الاصطناعي حياتنا؟
هل حان الوقت لتحديث Google Keep؟
تتضمن معاينة المطور لـ Android 16 تغييرًا مثيرًا: تجعل Google Keep تطبيقًا نظاميًا، مما يعني أنك لا تستطيع إلغاء تثبيته دون الوصول إلى الجذر. قد يبدو ذلك في البداية وكأنه إزعاج أكثر من كونه ميزة، لكنه يعني على الأرجح أن غوغل لديها خطط كبيرة لتطبيق تدوين الملاحظات الخاص بها، بما في ذلك تكاملات أعمق مع النظام - مثل القدرة على فتح التطبيق من شاشة القفل على هواتف بيكسل، على سبيل المثال.
أنا متحمس لاحتمالية ذلك. لقد استخدمت Google Keep لتدوين الملاحظات بسرعة بدافع الراحة لسنوات، لكنني لم أحبها كثيرًا. بالمقارنة مع التطبيقات الأخرى التي استخدمتها لتدوين الملاحظات - مثل Evernote، Obsidian، وApple Notes - يبدو أن Google Keep دائمًا ما كان بدائيًا بعض الشيء. يمكنك البحث في ملاحظاتك وإضافة تسميات، لكن لا يوجد تصنيف قوي؛ لا يمكنك إنشاء مجلدات، ولا يزال التطبيق متمسكًا بمفهومه الأصلي للملاحظات الممثلة كبطاقات على شكل ملاحظات لاصقة.
لكن إذا أصبح Google Keep محورًا أكبر لشركة غوغل، مع إضافة ميزات مثل المجلدات، وبعض تصنيفات الذكاء الاصطناعي المستندة إلى جميني، وربما إضافة سريع لفتح ملاحظة جديدة على Android كما هو الحال في Apple Notes على iOS، يمكنني أن أرى نفسي أستخدمه لأنني أرغب في ذلك، وليس فقط لأنه تطبيق تدوين الملاحظات الذي صادف أن يكون مثبتًا لدي.
وفي الوقت نفسه...
يبدو أن مولد الفيديو Veo 2 من غوغل مثير للإعجاب للغاية. أصدرت غوغل مجموعة من مقاطع الفيديو من مولد الفيديو Veo 2 الخاص بها هذا الأسبوع، ومن الصعب في معظم الأحيان تحديد أن هذه المقاطع لم تُصنع بواسطة أيدٍ بشرية. يبدو أن Veo 2 لديه فهم أفضل للأشياء مثل علم التشريح والفيزياء مقارنةً بالإصدار الأصلي، مما يسمح له بإنشاء مقاطع تحتوي على مستوى أقل من الأخطاء وأقل من الهلوسات. يمكنك الاشتراك في قائمة الانتظار لتجربة Veo 2 بنفسك عبر labs.google/videofx.
تجربة Whisk الجديدة من غوغل هي أداة لتوليد الأفكار المرئية. تتيح لك Whisk إنشاء صور بناءً على "إعداد" و"مشهد" و"نمط" تعرفهما. لكل جانب، يمكنك إما تحميل صورة موجودة أو إدخال نص. لديك أيضًا خيار تحسين الصور الناتجة من خلال التوجيه الإضافي. النتائج ليست عمومًا ذات جودة عالية، لكن غوغل تصف Whisk أكثر كأداة للتفكير الإبداعي بدلاً من إنشاء صور جاهزة للاستخدام. يمكنك تجربة Whisk الآن عبر labs.google/fx/tools/whisk.
يقال إن مراقبي الحقائق في جميني يقيّمون مواضيع لا يعرفون عنها شيئًا. وفقًا لتقارير من TechCrunch، لم يعد بإمكان المتعاقدين الذين يقيمون ردود جميني تخطي الردود التي تقع خارج فهمهم، حيث تشير التوجيهات من غوغل إلى أنه "لا ينبغي عليك تخطي المطالبات التي تتطلب معرفة متخصصة". هذا أمر مقلق! تذكر أن تتحقق من المعلومات المقدمة من الذكاء الاصطناعي قبل التصرف بناءً عليها.
الكذبة الحلقة 30