-

مشروع أسترا: مستقبل الذكاء الاصطناعي

(اخر تعديل 2024-10-29 01:26:59 )

يعد مشروع أسترا أحدث بروتوتيب من قسم الذكاء الاصطناعي في جوجل، DeepMind، والذي يركز على تطوير الذكاء الاصطناعي العام. تم تقديم مشروع أسترا خلال مؤتمر Google I/O 2024، حيث عرضت تقنية رائدة تمثل مستقبل المساعدات الذكية. على الرغم من أن الفيديو الذي أظهر قدرات البروتوتيب كان قصيرًا، إلا أنه أثار إعجاب المطورين واستقبل بشكل إيجابي.

تُظهر العروض التوضيحية قدرتين متواصلتين، مما يدل على أن ردود أسترا ليست عشوائية، بل يمكنها التعامل مع مجموعة متنوعة من المهام والأسئلة. تم تنفيذ أحد العروض على هاتف جوجل بكسل، والآخر على نظارات بروتوتيب. يقوم مشروع أسترا باستقبال تدفق مستمر من المدخلات الصوتية والمرئية، ويفسر المعلومات حول بيئته في الوقت الحقيقي، ويتفاعل مع المستخدم بطريقة محادثة.

ما الذي يفعله مشروع أسترا؟

مشروع أسترا هو مساعد ذكاء اصطناعي عالمي يعزز تفاعل المستخدمين مع هواتفهم أو أجهزتهم الأخرى. يتجاوز مشروع أسترا قدرات نماذج المساعدين الذكية الحالية. يعتمد على إدخال متعدد الأبعاد، حيث يأخذ في الاعتبار الصوت والفيديو. يقوم بترميز إطارات الفيديو بشكل مستمر، ويمزجها مع الكلام، وينظمها في تسلسل زمني للأحداث. تخزين هذه البيانات يوفر استرجاع فعّال وسياق أكبر في تدفق محادثة يشبه التفاعل البشري.

الهدف من أسترا هو فهم سياق البيئات الواقعية أثناء الرد على أوامر المستخدم بدلاً من التركيز على سؤال فردي. تذكر ما حولك وما سألته سابقًا يخلق شعورًا طبيعيًا بالتفاعل. لتحقيق ذلك، يجب أن تكون الاستجابة سريعة. على الرغم من وجود تأخير ملحوظ في العرض، إلا أن الردود كانت ذكية وسريعة.

معالجة في أبعاد متعددة باستخدام الذكاء الاصطناعي متعدد الأبعاد

من الإنجازات المذهلة لمشروع أسترا هو قدرته على التعامل مع المدخلات متعددة الأبعاد بسلاسة. تعتمد الحالة الحالية للذكاء الاصطناعي عادةً على نوع واحد من المدخلات في كل مرة. لكن أسترا يدمج البيانات من المصادر المرئية والسمعية بشكل متزامن، مما يضعها في سياق مع بيئتك المحيطة. وهذا يمكن أن يلغي الحاجة إلى تقديم وصف أكثر تفصيلاً مما تفعل مع إنسان.

تبرز قدرات أسترا للتعرف على الصور في الفيديو التوضيحي، لكن الصوت والفيديو ليسا المدخلات الوحيدة. الفيديو يبدأ بمستخدم يسأل أسترا: "قُل لي شيئًا يُصدر صوتًا"، بينما يقوم بمسح بيئة العمل بمساعدة كاميرا الهاتف. عندما يظهر مكبر صوت، يتعرف أسترا عليه. وعندما يقرب المستخدم كاميرته نحو المكبر، يشير بسهم إلى أحد دائرتين على المكبر ويسأل ماذا يسمى. يحدد أسترا بشكل صحيح أن هذا الجزء من المكبر هو "التويتر" الذي يُنتج الأصوات العالية التردد.

قدرات أسترا في الذاكرة تتجاوز تذكر المدخلات

بينما يسير المستخدم بجانب مكتب، يمكن رؤية نظارات على المكتب. يشير بكاميرته نحو النافذة ويسأل في أي حي هو. من هذه البيانات المحدودة، يتعرف أسترا على مكانه. ثم نرى قدرات أسترا في الذاكرة عندما يسأل المستخدم أين ترك نظاراته. يتذكر أسترا ما رآه سابقًا، لكنه لم يُذكر، ويقول إن النظارات على مكتب العمل بالقرب من تفاحة حمراء لتسهيل العثور عليها.

بينما لا يزال أسترا في مرحلة النموذج الأولي وذاكرة الهاتف محدودة، فإن ذاكرة أسترا قصيرة الأجل ومن المحتمل أن تكون قائمة على الجلسة. عندما تصبح الذاكرة المستمرة ممكنة وأكثر تكاملًا في مساعدي الذكاء الاصطناعي، قد تبدو هذه الوظائف الذاكرية قادرة على استرجاع المعلومات من جلسات سابقة. قد يؤدي هذا إلى تجارب ذكية شخصية للغاية حيث يتعلم أسترا عن مشاريعك المستمرة، تفضيلاتك الشخصية، وشخصيتك.

المزيد من مشروع أسترا في العمل

تم عرض تنوع أسترا من خلال إظهار مجموعة متنوعة من المهام المساعدة في العالم الحقيقي. كانت الأمثلة مبتكرة ومدروسة بشكل جيد. على سبيل المثال، عندما أشار المستخدم بكاميرته نحو مجموعة من الأقلام الملونة وسأل أسترا عن جملة تبدأ بنفس الحرف، أظهر أسترا قدراته اللغوية. على عكس العديد من ردود الذكاء الاصطناعي، كانت الجملة التالية ليست سيئة عند محاولة الحصول على مخرجات إبداعية باستخدام موجهات اللغة الطبيعية.

عندما سأل المستخدم أسترا عن جزء من الشيفرة البرمجية المعروضة على شاشة الكمبيوتر، حصل على إجابة صحيحة. ثم انتقل إلى نموذج النظارات ونظر إلى مخطط على سبورة بيضاء يبدو أنه لنظام موازنة الحمل. رسم سهمًا بين رسم خوادم وقاعدة البيانات، وسأل عما يمكن إضافته لجعل النظام أسرع. كانت الاستجابة التي تشير إلى إضافة ذاكرة تخزين مؤقت لتحسين السرعة مثيرة للإعجاب، استنادًا فقط إلى المدخلات المرئية لمخطط مرسوم باليد.

العمليات السحابية تدعم حاليًا ذكاء أسترا

يوضح العرض أن وحدات معالجة Tensor من جوجل، التي تم تحسينها بشكل كبير، تدعم مشروع أسترا. لا يعمل أسترا على الجهاز. تمتلك جوجل الريادة في تكنولوجيا الأجهزة عندما يتعلق الأمر بمعالجة النماذج اللغوية الكبيرة. من المعروف أن نماذج الذكاء الاصطناعي المدربة بالكامل عادة ما تكون أصغر. ومن الواضح أن جوجل تشير إلى أنها ستعمل في النهاية على الأجهزة المحمولة.

لن يكون ذلك مفاجئًا، حيث إن وحدات معالجة SoC الخاصة بجوجل قوية، وقد كانت كل جيل تحسينًا كبيرًا. ومع ذلك، لا نعرف ما يكفي عن اتجاه هذا النموذج الأولي المبكر. قد يتسبب أسترا في حدوث مشكلات تأخير بعد الإطلاق العام إذا اعتمد على السحابة والاتصال بالإنترنت المستمر.

مستقبل مساعدي الذكاء الاصطناعي

على الرغم من أن مشروع أسترا لا يزال في مراحله الأولى، وتتحرك تطورات الذكاء الاصطناعي بسرعة فائقة، يبدو أن جوجل هي الأولى التي تحقق مساعدًا ذكيًا مفيدًا. بفضل قدرته على معالجة العديد من مصادر المعلومات في الوقت الحقيقي، يمكن أن يصبح أداة يومية لمستخدمي الهواتف المحمولة. يمكن توسيع هذه التكنولوجيا لتشمل المنازل الذكية، الأوساط التعليمية، والمشاريع الإبداعية.

بالنظر إلى المستقبل، تخطط جوجل لدمج عناصر من أسترا في تطبيقها Gemini، مما قد يمنحنا فرصة للتفاعل المباشر. هذه الخطوة نحو التفاعل الطبيعي والاستجابة مع الذكاء الاصطناعي، مع الوعي بالسياق الواقعي، هي تغيير مرحب به. لقد حقق Google Gemini تقدمًا كبيرًا منذ بداياته كـ Bard. مع التكنولوجيا المبتكرة مثل مشروع أسترا، سنشهد قريبًا بعض ميزاته على أجهزة الأندرويد الخاصة بنا.


خواتي غناتي الحلقة 25