Dall-E 3 vs Midjourney: مقارنة صور الذكاء الاصطناعي جنبًا إلى جنب

نشرت: 2023-10-26

لقد كان Dall-E 3 من OpenAI موجودًا على الساحة منذ شهر تقريبًا، ويغوص المتحمسون المبدعون في كل مكان في حالات الاستخدام المختلفة. تبدو الإمكانات بلا حدود، بدءًا من إنشاء صور الذكاء الاصطناعي وحتى إنتاج الأفلام القصيرة.

ربما تطرح الآن بعض الأسئلة: هل تستحق لعبة Dall-E 3 كل هذا الضجيج حقًا؟ هل هو أفضل من ميدجورني؟

إذا كنت تستخدم Midjourney لتلبية احتياجات صور الذكاء الاصطناعي الخاصة بك، فقد تتساءل عما إذا كان التبديل مناسبًا أم لا.

في منشور المدونة هذا، سنتعمق في مقارنة متعمقة، حيث نضع Dall-E 3 في مواجهة Midjourney باستخدام 16 مطالبة متميزة لفهم نقاط القوة والعيوب في كل منصة.

ما هي DALL-E 3 وMidjourney؟

Dall-e 3 – Dall-e 3 vs Midjourney
دال إي 3

DALL-E 3 هو أحدث مولد فني للذكاء الاصطناعي من OpenAI.

إنه مدمج في ChatGPT، مما يجعله سهل الاستخدام، وهو متاح من خلال ChatGPT Plus مقابل 20 دولارًا شهريًا. بينما لا يزال في مرحلة تجريبية، فإنه يُحدث موجات في مجالات مختلفة للحصول على صور دقيقة.

تحقق من الدليل التفصيلي حول كيفية استخدام Dall-E 3.

منتصف الرحلة - dall-e مقابل منتصف الرحلة
منتصف الرحلة

على الجانب الآخر، لدينا Midjourney، وهو روبوت داخل Discord.

وهي معروفة بأساليبها وعواطفها الغنية في الصور. مقابل 10 دولارات شهريًا، يمكنك البدء بخطتهم الأساسية، ولكن كن مستعدًا لتعديل مطالباتك في بعض الأحيان.

لذلك، تقدم DALL-E 3 فنًا تفصيليًا من خلال منصة مخصصة، بينما تميل Midjourney، داخل Discord، إلى الإبداع والعاطفة. كلاهما لهما مزاياهما الخاصة. كل ذلك يأتي إلى ما تبحث عنه.

Dall-E 3 vs Midjourney: مصفوفة مقارنة

دال-E 3 منتصف الرحلة
سهولة الاستعمال سهل جدا واسطة
يكلف 20 دولارًا شهريًا يبدأ بـ 10 دولارات شهريًا
جودة الصورة مزيد من الفروق الدقيقة والتفاصيل جيد
نمط الصورة يدعم جميع الأنماط الفنية يدعم جميع الأنماط الفنية
حجم الصورة مربع، طويل، وواسع يدعم الأحجام المخصصة
إِبداع يفهم نية المستخدم ضبط مستويات الإبداع
سرعة توليد الصورة أبطأ قليلا بضع ثوان
حقوق الطبع والنشر لصور الذكاء الاصطناعي يمتلك المستخدمون الصور التي قاموا بإنشائها يمتلك المستخدمون الصور التي قاموا بإنشائها
الواقعية أقل شبهاً بالحياة ولكن أكثر تفصيلاً أكثر واقعية
التخصيص خيارات التخصيص محدودة المزيد من خيارات التخصيص

Dall-E 3 vs Midjourney: المواجهة النهائية

يمكن أن يمنحك النظر إلى جدول المقارنة فكرة موجزة، لكنك لن تفهم نقاط القوة والضعف لدى كل منشئ فنون الذكاء الاصطناعي إلا من خلال إجراء مقارنة جنبًا إلى جنب.

في هذا القسم، اخترنا بعضًا من أفضل الصور وأنواع الفنون. سنستخدم نفس الموجه في Dall-E 3 وMidjourney لكل نوع لمقارنة النتائج.

ملاحظة: تم إنشاء جميع الصور الموجودة على اليسار في DALL-E 3، وعلى اليمين تم إنشاؤها بواسطة Midjourney.

المناظر الطبيعية

مستعجل: حقول القمح الذهبية تحت سماء عاصفة، مع فزاعة وحيدة ترتدي وشاحًا أحمر ساطعًا

تتميز صورة Dall-E 3 بأسلوب توضيحي مفصل مع لون ذهبي دافئ، مما يعرض شخصية تشبه الفزاعة. في المقابل، تتمتع صورة Midjourney بإحساس فوتوغرافي أكثر، مع التركيز على شخصية ترتدي عباءة في عاصفة تلوح في الأفق، مرسومة بألوان بني داكن. لقد فاتتها الفزاعة تمامًا.

المفاهيم المجردة

مستعجل: تمثيل مرئي لصوت الضحك باستخدام رشقات نارية نابضة بالحياة من الألوان والأنماط الدوامة

تحتوي صورة Dall-E 3 على العديد من الألوان المختلطة، وتبدو وكأنها تدور، مع الكثير من الألوان الزرقاء، مما يجعلها تبدو حالمة. تُظهر صورة Midjourney سيدة تضحك مع وجود أنماط ملونة حولها، مما يجعل الضحك يبدو حيًا وحقيقيًا. وكلاهما رائع في إظهار متعة الضحك.

على الرغم من أن Midjourney قام بعمل رائع، إلا أن الصورة لا تبدو وكأنها فن تجريدي. لقد فهم Dall-E 3 القصد من المطالبة وقام بإنشاء صورة مجردة.

الإعدادات التاريخية

مستعجل: مصارع يستعد للمعركة في الكولوسيوم الروماني، ويعدل خوذته ويمسك بدرعه

على اليسار، يُظهر Dall-E 3 مصارعًا يرتدي خوذة مفصلة ومزخرفة يقف أمام الكولوسيوم. الأجواء أكثر هدوءًا، وأشعة الشمس تضيء معداته.

على اليمين، تعرض صورة Midjourney مصارعًا أكثر قوة في لحظة حميمة. يبدو هذا المحارب ضائعًا في أفكاره، وربما يفكر في المعركة المقبلة. لقد أصبح درعه أكثر اهتراءًا في المعركة، ويبدو المشهد أكثر قتامة وأكثر كثافة. يمسك درعه المزخرف بإحكام، مما يظهر تصميمه.

كلتا الصورتين تبدو حقيقية. لقد قام Dall-E 3 بتضمين كل ما طلبناه تقريبًا في الموجه، لكن Midjourney أخطأت الخوذة والكولوسيوم. غاب Dall-E 3 أيضًا عن الجزء " ضبط الخوذة ".

مشاهد مستقبلية

مستعجل: موسيقيو الشوارع السيبرانيون يعزفون آلات مضيئة في زقاق مضاء بالنيون في إحدى المدن الكبرى

تُظهر الصورة اليسرى لـ Dall-E 3 زقاقًا طويلًا وهادئًا مع موسيقيين يشبهون الكائنات الفضائية ولافتات نيون ساطعة. لقد تأكدت من الحصول على تفاصيل مثالية للخلفية أيضًا. تبدو الصورة الصحيحة من Midjourney أكثر انشغالًا، مع مزيج من البشر والروبوتات وزقاق أوسع وحيوي مليء بانعكاسات أضواء النيون. في حين أن كلتا الصورتين تُظهران موسيقيين مستقبليين في أزقة مضاءة بالنيون، فإن Dall-E's تبدو وكأنها على كوكب آخر، بينما تتمتع Midjourney's بمزيج من مشاعر اليوم والمستقبل.

صور

مستعجل: امرأة مسنة ذات شعر فضي مربوط على شكل كعكة، ترتدي نظارات عتيقة وتطرز نمطًا ملونًا

تلتقط هاتان الصورتان بشكل جميل امرأة مسنة تعمل على التطريز. تُظهر صورة Dall-E 3 الموجودة على اليسار امرأة ترتدي نظارة عتيقة مذهلة وشعر فضي مربوط في كعكة. إنها تعمل على نمط نابض بالحياة. تم تحسين الأجواء، مع إضاءة ناعمة تسلط الضوء على ملامحها. تبدو الصورة الصحيحة التي التقطتها Midjourney أكثر صراحة، حيث ترتدي السيدة نظارات غير رسمية ذات إطار أسود وترتدي بلوزة ملونة.

تؤكد كلتا الصورتين على فن التطريز، لكن Dall-E 3 يميل نحو الأناقة بينما يشعر Midjourney بالدفء والأصالة.

فن البكسل

مستعجل: ساحر يلقي تعويذة، مع جزيئات سحرية وكتاب تعويذة عائم، على خلفية غابة مسحورة منقطة

على اليسار، يقدم Dall-E 3 صورة منقطة لخلفية غابة مع الساحر مرتديًا ملابس زرقاء داكنة وقبعة طويلة، مما يحاكي أجواء ألعاب الفيديو القديمة. يمكنك رؤية الجزيئات السحرية التي تحوم حوله وكتاب الإملاء العائم، المفتوح على مصراعيه، ويعرض صفحاته المتوهجة.

الآن، على اليمين، يرسم Midjourney صورة أكثر واقعية. يتم تصوير الساحر على أنه رجل شاب ذو مظهر حاد ومنغمس بشدة في عملية إلقاء التعويذة. تظهر الجزيئات السحرية بوضوح، وتحيط بكتاب التهجئة الذي يحمله والذي يشبه الجرم السماوي. على الرغم من أن خلفية الغابة واضحة، إلا أنها ليست منقطة كما طلب الموجه.

في حين أن كلتا الصورتين تصوران ساحرًا يلقي تعويذة ببراعة، إلا أن Dall-E 3 فقط هو الذي نجح في إظهار التفاصيل "المنقطة".

الفن السريالي

مستعجل: فراشة كبيرة الحجم تقرأ كتابًا لدائرة من الأفيال الصغيرة المنتبهة على جزيرة عائمة

يتم إنشاء كلتا الصورتين باستخدام نفس الموجه ولكنهما يرسمان مشاهد مختلفة تمامًا. صورة Dall-E 3 نابضة بالحياة وممتعة، حيث تعرض فراشة برأس فيل تقرأ كتابًا للأفيال الصغيرة على أرض عائمة.

من ناحية أخرى، تتمتع صورة Midjourney بإحساس الغابة المسحورة مع جزيرة الفيل العملاقة والعديد من الأفيال الصغيرة التي تقوم بأنشطة مختلفة. لكن نسخة Midjourney تفتقد العنصر المركزي المتمثل في "الفراشة كبيرة الحجم".

تصميم شقة

مستعجل: بطاقة بريدية مبسطة تعرض جوهر طوكيو من خلال الصور الظلية المميزة مثل برج طوكيو، ولفائف السوشي، وفرع أزهار الكرز

تلتقط كلتا الصورتين جوهر طوكيو باستخدام برج طوكيو والسوشي وأزهار الكرز. إصدار Dall-E 3 نابض بالحياة، حيث يعرض منظرًا تفصيليًا للمدينة ولفائف السوشي على خلفية مشرقة، وأزهار الكرز خصبة.

في المقابل، تتميز Midjourney بأسلوب هادئ وبسيط مع لوحة ألوان الباستيل، وهياكل مبسطة، وعدد أقل من أزهار الكرز.

في حين أن كلا الإبداعين يشملان العناصر المطلوبة، يضيف Dall-E 3 ميزات إضافية مثل النهر والجسر. من حيث الجودة، فإن صورة Dall-E أكثر ثراءً بالتفاصيل، في حين تعطي صورة Midjourney الأولوية للبساطة والمساحة المفتوحة.

عروض ثلاثية الأبعاد

مستعجل: قلادة تنين اليشم ثلاثية الأبعاد مفصلة بعيون ياقوتية، معلقة على سلسلة فضية رقيقة على خلفية مخملية

تتطابق قلادة Dall-E (على اليسار) بشكل وثيق مع مظهر "اليشم" بلونها الأخضر ولها عيون حمراء ياقوتية، لكن السلسلة الفضية تبدو أكثر سمكًا من المتوقع. الخلفية تبدو مثل المخمل.

لا تشبه قلادة Midjourney (على اليمين) اليشم كثيرًا ولها ملمس معدني أكثر، لكن عيونها الياقوتية بارزة. السلسلة هنا أكثر تفصيلاً، والخلفية داكنة تمامًا. بالمقارنة مع الموجه، تتوافق صورة Dall-E بشكل أفضل مع تفاصيل "اليشم" و"الخلفية المخملية"، بينما تبرز صورة Midjourney جانب "السلسلة الفضية".

التوضيح الرقمي

مستعجل: رسم توضيحي رقمي لقطة مؤذية تحاول تسلل سمكة من وعاء بينما يصرخ ببغاء قريب محذرًا

تُظهر كلتا الصورتين قطة تحاول الحصول على سمكة من وعاء مع وجود ببغاء قريب منها. تظهر صورة Dall-E 3 على اليسار قطة مخططة باللون الرمادي تلامس الماء بهدوء، والببغاء يراقب فقط.

في صورة Midjourney على اليمين، تبدو القطة متفاجئة، ولا يوجد ببغاء. تحتوي صورة Dall-E على مزيد من التفاصيل والملمس، مما يجعلها تبدو أكثر صقلًا. تبدو صورة Midjourney مستعجلة وتحتوي على بيئة أكثر قتامة مع عناصر مفقودة.

طلاء زيتي

مستعجل: بحار مهيب غارق في أفكاره، يحمل بوصلة قديمة، والبحر المضطرب والسحب العاصفة في الخلفية

الصورة اليسرى، التي التقطتها Dall-E 3، تظهر بحارًا أكبر سنًا يبدو مفكرًا وبحر عاصف خلفه. أما اللوحة اليمنى، التي كتبها Midjourney، فتظهر بحارًا أصغر سنًا يتطلع إلى بحر أكثر هدوءًا. تتطابق كلتا الصورتين مع الموجه، لكن Dall-E تبدو أقرب بسبب الخلفية العاصفة. جودة الصورة جيدة في كليهما، لكنهما يعطيان مشاعر مختلفة: يشعر المرء بالرغبة في النظر إلى مغامرات الماضي، والآخر يشعر بالاستعداد لمغامرة جديدة.

الديوراما

مستعجل: مشهد كرنفال مصغر، مع عجلة فيريس عاملة، وزائرين صغار يستمتعون بحلوى القطن، ومهرج يتلاعب بالأجرام السماوية المتوهجة بأسلوب الديوراما

تُظهر كلتا الصورتين مشاهد كرنفال مصغرة بعجلات فيريس. الصورة اليسرى من Dall-E 3 تُظهر زوارًا يحملون حلوى القطن ومهرجًا يتلاعبون بالأجرام السماوية المتوهجة، مما يتناسب مع الاتجاه جيدًا. تتميز الصورة الصحيحة من Midjourney بإحساس ليلي وتصميمات أكثر تعقيدًا ولكنها لا تظهر للزائرين حلوى القطن أو المهرج الذي يتلاعب بالألعاب. في حين أن كلتا الصورتين تتمتعان بجودة جيدة، إلا أن صورة Dall-E تتوافق بشكل أقرب إلى تفاصيل الموجه، في حين تقدم صورة Midjourney لقطة فريدة من نوعها، لكن الزوار الصغار ليسوا واضحين تمامًا.

بنيان

مستعجل: مكتبة بيت الشجرة غريبة الأطوار مع سلالم حلزونية وفوانيس معلقة وشرفات مليئة بالكتب

الصورة اليسرى من Dall-E 3 أشبه بالخيال، مع العديد من التفاصيل والفوانيس وبيت الشجرة الأكبر. تبدو الصورة الصحيحة التي التقطها Midjourney أقرب إلى الحياة الواقعية، مع عدد أقل من الغرف والفوانيس. تلتقط الصورتان فكرة "مكتبة الشجرة" ذات السلالم الحلزونية وشرفات الكتب. كلاهما يتبعان الموجه جيدًا.

ومع ذلك، فإن صورة Dall-E تتمتع بإحساس أكثر حالمة مع توهجها الأخضر، بينما تبدو صورة Midjourney في المساء وتشعر براحة أكبر.

تتميز كلتا الصورتين بجودة عالية، ولكن الاختيار بينهما هو ما إذا كنت تفضل المظهر الأكثر سحرًا أو الواقعية.

تصميم داخلي

عاجل: غرفة نوم بوهيمية بها سرير أرجوحة، ومفروشات على الجدران، ومرآة من الفسيفساء، ونباتات معلقة من السقف

تلتقط كلتا الصورتين إحساسًا بغرفة النوم البوهيمية. صورة Dall-E (على اليسار) ملونة بالأنماط ولها مقعد يشبه الأرجوحة، ومفروشات شفافة، والعديد من النباتات المعلقة، لكنها تفتقر إلى مرآة الفسيفساء.

صورة Midjourney (على اليمين) أخف وزنًا وأكثر اتساعًا، مع نباتات ونسيج من الدانتيل، لكن سريرها ليس على شكل أرجوحة شبكية، ولا توجد مرآة فسيفساء مرئية.

في حين أن كلتا الصورتين تحتويان على عناصر بوهو ونباتات معلقة، إلا أنهما لا يتطابقان تمامًا مع الموجه، خاصة فيما يتعلق بمرآة الفسيفساء والوصف الدقيق لسرير الأرجوحة.

مطالبات السياق عالية

مستعجل: ورشة حدادة خلال عصر النهضة، بأدوات تفصيلية، وصياغة متوهجة، وقطع دروع معقدة، وحرفي في العمل

يحتوي الجزء الأيسر من Dall-E على حداد واحد وأدوات منظمة بدقة ودرع مميز. تحتوي اللعبة المناسبة من Midjourney على عدة أشخاص وأدوات متناثرة وأجواء مفعمة بالحيوية. بينما يصور كلاهما ورشة العمل، تركز صورة Dall-E على حرفي واحد وأدواته، وتبدو صورة Midjourney وكأنها يوم حافل مع العديد من العمال.

مطالبات السياق المنخفض

المستعجل: رقصة ضوء القمر

تعرض كلتا الصورتين "رقصة مقمرة". تتميز الصورة اليسرى من Dall-E بلون أزرق نابض بالحياة مع راقصين مظللين أمام قمر كبير، بينما توفر الصورة من Midjourney، على اليمين، نظرة أقرب وأكثر تفصيلاً على الراقصين مع توهج قمر أكثر دقة. يركز Dall-E على البيئة والتناقضات، بينما يسلط Midjourney الضوء على مشاعر الراقصين. كلاهما يجسد موضوع الرقص في ضوء القمر ولكن بأساليب مختلفة.

المواجهة: Midjourney vs Dall-E 3

بعد تقييم 16 صورة تم إنشاؤها بواسطة الذكاء الاصطناعي من Dall-E 3 وMidjourney، من الواضح أن Dall-E 3 تتفوق في التقاط التفاصيل المعقدة. تتفوق هذه المنصة أيضًا على Midjourney في تفسير القصد من المطالبات لإنشاء الصور ذات الصلة. من ناحية أخرى، تتمتع Midjourney بميزة في صياغة العناصر المرئية التي تبدو حقيقية. بينما يهدف Dall-E 3 إلى الكمال، فإنه قد ينتج في بعض الأحيان صورًا أقل طبيعية.

بالنسبة للشركات التي تبحث عن التفاصيل في مرئيات الذكاء الاصطناعي الخاصة بها، قد يكون Dall-E 3 هو الخيار الأكثر ملاءمة. يمكنك الوصول إليه عبر ChatGPT Plus وأيضًا في Photosonic، أفضل مولد صور يعمل بالذكاء الاصطناعي، قريبًا جدًا. تخطط OpenAI لإصدار Dall-E 3 API قريبًا، مما يجعلها ميزة متكاملة في Photosonic.

الأسئلة الشائعة

1. هل Midjourney أفضل من DALL-E 3؟

لا يتعلق الأمر حقًا بكون أحدهما "أفضل" تمامًا من الآخر. لديهم أساليب وقدرات مختلفة. تم دمج DALL-E 3 مع ChatGPT Plus وهو جزء من الحزمة التي تحصل عليها مع GPT-4. من ناحية أخرى، قد تقدم Midjourney اختلافات في عروضها. يتعلق الأمر بتفضيلاتك الشخصية والأسلوب الذي تبحث عنه.

2. هل DALL-E 3 مجاني؟

لا، DALL-E 3 ليست مجانية. إنه مرفق مع ChatGPT Plus، والذي يكلف 20 دولارًا شهريًا. يمنحك هذا الاشتراك أيضًا إمكانية الوصول إلى GPT-4.

3. أيهما أرخص DALL-E 3 أم Midjourney؟

وبالنظر بدقة إلى الأرقام، تبدأ Midjourney بسعر أرخص قدره 10 دولارات شهريًا. يأتي DALL-E 3 مزودًا بـ ChatGPT Plus، والذي يبلغ سعره 20 دولارًا شهريًا. لذا، إذا كانت الميزانية عاملاً رئيسيًا، فقد تكون Midjourney هي خيارك الأكثر فعالية من حيث التكلفة.