-

الذكاء الاصطناعي في الفن الرقمي والتصميم

(اخر تعديل 2025-03-01 13:04:51 )

لقد أحدث الذكاء الاصطناعي ثورة في عالم الفن الرقمي والتصميم الإبداعي. بفضل تقنيات الذكاء الاصطناعي التوليدية، يمكنك الآن إنشاء أعمال فنية رائعة باستخدام جهازك اللوحي أو كروم بوك. في هذا الدليل، سنستعرض نموذجين بارزين هما Janus-Pro-7B (DeepSeek) وDALL·E 3 (ChatGPT)، مع مقارنة أيهما قادر على إنتاج صور واقعية أكثر.

DALL·E 3: نموذج مبتكر يعتمد على النمذجة الانتشارية

DALL·E 3 هو نموذج توليدي يعتمد على المعالجة الانتشارية، وقد تم تدريبه على مجموعات بيانات متعددة الوسائط ضخمة. هذه التقنية تمكنه من إنشاء صور تفصيلية عبر أنماط فنية متنوعة. ومن أبرز ميزات DALL·E 3 هو تكامله القوي مع ChatGPT، مما يعزز من قدرته على فهم الأوصاف المعقدة بدقة أكبر.

لا يقتصر دور DALL·E 3 على فهم الصور فقط، بل يقوم أيضًا بإنشاءها بفضل النماذج البصرية التي تطورها OpenAI. إذ تقوم OpenAI بدمج نماذج بصرية منفصلة لتحليل الصور ومعالجتها.

Janus-Pro-7B: فصل الفهم عن إنشاء الصور بتصميم مزدوج

نموذج Janus-Pro-7B هو نموذج توليدي من DeepSeek يحتوي على 7 مليار معلمة. يتم تدريب الشبكات العصبية في Janus-Pro-7B لإنتاج مخرجات دقيقة ومنظمة. يعتمد تصميمه على فصل الفهم البصري عن إنشاء الصور من النصوص. بينما يقوم DALL·E 3 بإنتاج الصور فقط، يقوم Janus-Pro-7B بمعالجة الصور والنصوص على حد سواء.

يحتوي Janus-Pro-7B على مشفرين متخصصين بدلًا من واحد. يقوم المشفر الأول بفهم الصور وتحليلها، بينما يقوم المشفر الثاني بتحويل الأوصاف إلى عناصر بصرية، مما يمكّن النموذج من إنشاء صور وفقًا للتعليمات النصية.

مقارنة الواقعية في الصور الناتجة عن الذكاء الاصطناعي من Janus-Pro-7B وDALL·E 3

النص المطلوب: صورة واقعية لنبتة صبار في وعاء ودراجة.

تبين الصورة الأولى التي أنشأها DALL·E 3 إضاءة مصطنعة مفرطة ونقص في العيوب الطبيعية التي تعتبر ضرورية لتحقيق الواقعية. حتى بعد تحسين النص للحصول على نتيجة أكثر واقعية، لم ينجح DALL·E 3 في الوصول إلى جودة DeepSeek، حيث أضاف نبتة إضافية وكاميرا قديمة لم تُذكر في النص الأصلي. وهذا يدل على ميله لأخذ حريات إبداعية بدلاً من الالتزام بالواقعية.

على الجانب الآخر، أنشأ Janus-Pro-7B صورة واحدة لنبتة صبار مع خلفية ضبابية، مما أنتج جودة تصويرية طبيعية. تبدو عمق المجال والإضاءة والملمس في صورة Janus-Pro-7B واقعية. كما أن الانعكاسات في الصورة، وخاصةً على الدراجة، كانت واقعية بشكل ملحوظ. بشكل عام، يقدم Janus-Pro-7B واقعية أعلى من خلال الحفاظ على الدقة والامتثال للنص.

مقارنة التوزيع المكاني في DALL·E 3 وJanus-Pro-7B

النص المطلوب: صورة لكلب أسود على اليسار، وقطة في المنتصف، وفأر على اليمين.

تصور الصورة الأولى التي أنشأها ChatGPT مشهدًا خارجيًا مع كلب أسود وقطة وفأر، لكن توزيعهم لم يتبع التعليمات المحددة بدقة. بينما اتبع DeepSeek التعليمات بدقة، حيث وضع الكلب الأسود على اليسار والقطة في المنتصف والفأر على اليمين. على الرغم من أن كلا الصورتين كانتا كارتونيتين، إلا أن نتيجة DeepSeek كانت ذات دقة أقل وتفاصيل أقل دقة.
المداح 5: أسطورة العهد الحلقة 3

مقارنة DALL·E 3 وJanus-Pro-7B مع عناصر متعددة في النصوص المعقدة

النص المطلوب: قطة برتقالية زغبية ذات عيون خضراء تتكاسل على ممر حجري في حديقة يابانية.

النماذج التي تعالج النصوص الكثيفة تفسر العناصر المتعددة والقيود وتفاصيل الأسلوب لإنشاء الصور. في اختبارات المقارنة، حصل Janus-Pro-7B على 84.19 في DPG-Bench، بينما حصل DALL-E 3 على 83.50، مما يظهر قدرة متشابهة على إنشاء مشاهد معقدة. ومع ذلك، تُظهر المقارنة بينهما اختلافات في التفسير والتفاصيل.

يحتوي DALL-E 3 على جميع العناصر تقريبًا، بما في ذلك زهور الكرز والممر الحجري وحديقة يابانية مع باجودا وجسر، لكن القطة تفتقر إلى الواقعية. بينما يغطي DeepSeek معظم العناصر لكنه يفتقد بعض العلامات الثقافية الرئيسية. ومع ذلك، يحقق DeepSeek انتصارًا مرة أخرى لأنه يتقيد بوصف واقعي أكثر لقطة برتقالية زغبية، حتى لو كان ذلك يعني التضحية ببعض تعقيد الخلفية.

مقارنة DALL·E 3 وJanus-Pro-7B في دقة الألوان

النص المطلوب: تركيبة تحتوي على موزة صفراء زاهية، وتفاحة حمراء عميقة، وكوب سيراميك أزرق غني، وكمثرى خضراء، جميعها موضوعة على طاولة رخامية بيضاء.

تعتبر دقة الألوان فرقًا رئيسيًا بين DeepSeek (Janus-Pro-7B) وDALL-E 3. حيث تظهر موزة DeepSeek بلون أصفر طبيعي ومتوازن، بينما تظهر موزة DALL-E 3 بلون شمعي. بينما يعرض كوب DeepSeek الأزرق بلون هادئ ومعتدل، يظهر DALL-E 3 بلون أزرق غامق. على الرغم من أن كلا النموذجين يصوران تفاحة حمراء ذات قوام طبيعي، إلا أن DALL-E 3 يضيف تباينًا لونيًا للكمثرى مع لمحات من اللون البرتقالي، بينما تظهر كمثرى DeepSeek بلون أكثر تجانسًا.

تؤثر الإضاءة أيضًا على إدراك اللون. يستخدم DeepSeek تأثيرات ضوء نهاري أكثر نعومة، مما يحافظ على الألوان بشكل واقعي، بينما يستخدم DALL-E 3 إضاءة أقسى وارتفاعًا في التباين، مما ينتج عنه ألوان زاهية ولكن أقل طبيعية. يظهر DeepSeek (Janus-Pro-7B) تفوقًا في الواقعية اللونية، وخاصةً لكوب السيراميك، بينما يفضل DALL-E 3 مظهرًا عالي التباين وأسلوبًا يغير من دقة اللون.

الحكم النهائي: DALL·E 3 للإبداع، Janus-Pro-7B للواقعية

يعتمد الاختيار بين DALL·E 3 وJanus-Pro-7B على احتياجاتك الإبداعية. يقدم DALL·E 3 مخرجات مصقولة مع ألوان زاهية لمرونة فنية أكبر. إذا كنت تفضل الواقعية، والدقة في توزيع العناصر، والامتثال للنصوص، فإن Janus-Pro-7B يقدم أسلوبًا تصويريًا طبيعيًا.