Dall-E 3 kontra Midjourney: porównanie obrazów AI obok siebie

Opublikowany: 2023-10-26

Dall-E 3 z OpenAI jest na scenie od około miesiąca, a entuzjaści kreatywności na całym świecie zagłębiają się w różne zastosowania. Potencjał wydaje się nieograniczony, od tworzenia obrazów AI po produkcję filmów krótkometrażowych.

Teraz możesz zadawać pytania: czy Dall-E 3 naprawdę jest wart tego szumu? Czy jest lepszy od Midjourneya?

Jeśli używasz Midjourney do potrzeb związanych z obrazem AI, możesz się zastanawiać, czy przełącznik jest w porządku.

W tym poście na blogu zajmiemy się szczegółowym porównaniem, podczas którego porównamy Dall-E 3 z Midjourney, korzystając z 16 różnych podpowiedzi, aby zrozumieć mocne i słabe strony każdej platformy.

Czym są DALL-E 3 i Midjourney?

Dall-e 3 - Dall-e 3 kontra środek podróży
Dall-e 3

DALL-E 3 to najnowszy generator grafiki AI OpenAI.

Jest wbudowany w ChatGPT, dzięki czemu jest przyjazny dla użytkownika i jest dostępny poprzez ChatGPT Plus za 20 dolarów miesięcznie. Będąc jeszcze w fazie beta, generuje fale w różnych dziedzinach, zapewniając precyzyjne obrazy.

Zapoznaj się ze szczegółowym przewodnikiem dotyczącym korzystania z Dall-E 3.

Midjourney – Dall-e kontra Midjourney
W połowie podróży

Z drugiej strony mamy Midjourney, bota w Discord.

Jest znany z bogatego stylu i emocji w obrazach. Za 10 USD miesięcznie możesz zacząć od podstawowego planu, ale czasami bądź gotowy na ulepszenie swoich podpowiedzi.

Tak więc DALL-E 3 oferuje szczegółową grafikę za pośrednictwem dedykowanej platformy, podczas gdy Midjourney w ramach Discord opiera się na kreatywności i emocjach. Obydwa mają swoje zalety. Wszystko sprowadza się do tego, czego szukasz.

Dall-E 3 kontra Midjourney: macierz porównawcza

Dall-E 3 W połowie podróży
Łatwość użycia Bardzo łatwe Średni
Koszt 20 dolarów miesięcznie Zaczyna się od 10 dolarów miesięcznie
Jakość obrazu Więcej niuansów i szczegółów Dobry
Styl obrazu Obsługuje wszystkie style artystyczne Obsługuje wszystkie style artystyczne
Rozmiar obrazu Kwadratowy, wysoki i szeroki Obsługuje niestandardowe rozmiary
Kreatywność Rozumie intencje użytkownika Dostosuj poziom kreatywności
Szybkość generowania obrazu Trochę wolniej Kilka sekund
Prawa autorskie do obrazów AI Użytkownicy są właścicielami utworzonych przez siebie obrazów Użytkownicy są właścicielami utworzonych przez siebie obrazów
Realizm Mniej realistyczne, ale bardziej szczegółowe Bardziej realistyczne
Dostosowywanie Ograniczone możliwości dostosowywania Więcej opcji dostosowywania

Dall-E 3 kontra Midjourney: Ostateczna rozgrywka

Przeglądanie tabeli porównawczej może dać ci krótkie pojęcie, ale mocne i słabe strony każdego generatora grafiki AI zrozumiesz jedynie poprzez bezpośrednie porównanie.

W tej sekcji starannie wybraliśmy jedne z najlepszych obrazów i rodzajów dzieł sztuki. Użyjemy tego samego podpowiedzi w Dall-E 3 i Midjourney dla każdego typu, aby porównać wyniki.

Uwaga: wszystkie obrazy po lewej stronie zostały utworzone w DALL-E 3, a po prawej przez Midjourney.

Krajobrazy

Podpowiedź: Złote pola pszenicy pod burzliwym niebem, z samotnym strachem na wróble ubranym w jaskrawoczerwony szalik

Obraz Dall-E 3 ma szczegółowy, ilustracyjny styl i ciepły, złoty odcień, przedstawiający postać przypominającą stracha na wróble. Dla kontrastu, obraz Midjourney ma bardziej fotograficzny charakter, skupiając się na zamaskowanej postaci podczas nadchodzącej burzy, namalowanej w odcieniach sepii. Całkowicie ominęło stracha na wróble.

Abstrakcyjne koncepcje

Podpowiedź: wizualna reprezentacja dźwięku śmiechu za pomocą żywych wybuchów kolorów i wirujących wzorów

Obraz Dall-E 3 ma wiele mieszanych kolorów, które wyglądają, jakby się wirowały, z dużą ilością błękitu, co sprawia, że ​​wydaje się on marzycielski. Zdjęcie Midjourney przedstawia śmiejącą się kobietę, a wokół niej znajdują się kolorowe wzory, dzięki czemu śmiech wydaje się żywy i prawdziwy. Obaj są fajni w pokazywaniu radości śmiechu.

Chociaż Midjourney wykonał świetną robotę, obraz nie wygląda jak sztuka abstrakcyjna. Dall-E 3 zrozumiał intencję podpowiedzi i wygenerował abstrakcyjny obraz.

Ustawienia historyczne

Podpowiedź: Gladiator przygotowujący się do bitwy w rzymskim Koloseum, poprawiający hełm i ściskający tarczę

Po lewej stronie Dall-E 3 przedstawia gladiatora ze szczegółowym i ozdobnym hełmem stojącego przed Koloseum. Atmosfera jest spokojniejsza, a światło słoneczne oświetla jego sprzęt.

Po prawej stronie zdjęcie w trakcie podróży przedstawia bardziej surowego gladiatora w intymnej chwili. Ten wojownik wydaje się zamyślony, być może zastanawiając się nad nadchodzącą bitwą. Jego zbroja jest bardziej zużyta po walce, a scena wydaje się mroczniejsza i bardziej intensywna. Mocno ściska swoją ozdobną tarczę, pokazując swoją determinację.

Obydwa obrazy wyglądają jak prawdziwe. Dall-E 3 zawierał prawie wszystko, o co prosiliśmy w monicie, ale w Midjourney brakowało hełmu i Koloseum. Dall-E 3 również pominął część dotyczącą regulacji kasku .

Futurystyczne sceny

Podpowiedź: Cybernetyczni muzycy uliczni grający na świetlistych instrumentach w oświetlonej neonami alei metropolii

Zdjęcie po lewej stronie, wykonane przez Dall-E 3, przedstawia spokojną, długą uliczkę z muzykami przypominającymi kosmitów i jasnymi neonami. Zadbano także o doskonałe szczegóły tła. Prawy obraz autorstwa Midjourney wydaje się bardziej zajęty, z mieszanką ludzi i robotów oraz szerszą, tętniącą życiem ulicą wypełnioną odbiciami neonów. Podczas gdy oba zdjęcia przedstawiają futurystycznych muzyków w oświetlonych neonami alejkach, Dall-E sprawia wrażenie jak na innej planecie, a Midjourney to mieszanka teraźniejszości i przyszłości.

Portrety

Podpowiedź: Starsza kobieta ze srebrnymi włosami związanymi w kok, w okularach w stylu vintage i haftująca kolorowy wzór

Te dwa obrazy pięknie ukazują starszą kobietę pracującą nad haftem. Zdjęcie Dall-E 3 po lewej stronie przedstawia kobietę w efektownych okularach w stylu vintage i srebrnych włosach związanych w kok. Pracuje nad żywym wzorem. Atmosfera jest wyrafinowana, a delikatne oświetlenie podkreśla jej cechy. Prawe zdjęcie Midjourney wydaje się bardziej szczere, gdzie dama nosi bardziej swobodne okulary w czarnych oprawkach i jest ubrana w kolorową bluzkę.

Obydwa obrazy podkreślają sztukę haftu, ale Dall-E 3 skłania się ku elegancji, podczas gdy Midjourney jest przytulny i autentyczny.

Pikselowa sztuka

Podpowiedź: Mag rzucający zaklęcie z magicznymi cząsteczkami i unoszącą się w powietrzu księgą zaklęć na pikselowanym tle zaczarowanego lasu

Po lewej stronie Dall-E 3 oferuje pikselowany obraz tła lasu z magiem odzianym w granatowy strój i wysokim kapeluszem, odwzorowującym klimat oldschoolowych gier wideo. Możesz zobaczyć magiczne cząsteczki wirujące wokół niego i unoszącą się w powietrzu księgę zaklęć, która jest szeroko otwarta, ukazując świecące strony.

Teraz, po prawej stronie, Midjourney przedstawia bardziej realistyczny obraz. Mag jest przedstawiany jako młody mężczyzna o intensywnym wyglądzie, głęboko pochłonięty akcie rzucania zaklęć. Magiczne cząsteczki są wyraźnie widoczne, otaczając świecącą księgę zaklęć przypominającą kulę, którą trzyma. Chociaż tło lasu jest oczywiste, nie jest ono podzielone na piksele, jak prosił monit.

Chociaż oba obrazy doskonale przedstawiają maga rzucającego zaklęcie, tylko Dall-E 3 uchwycił „pikselowane” szczegóły.

Sztuka surrealistyczna

Podpowiedź: Ogromny motyl czytający książkę kręgu uważnych, małych słoni na pływającej wyspie

Obydwa obrazy są tworzone przy użyciu tego samego podpowiedzi, ale przedstawiają bardzo różne sceny. Obraz Dall-E 3 jest żywy i zabawny, przedstawia motyla z głową słonia czytającego książkę małym słonikom na pływającym lądzie.

Z drugiej strony obraz Midjourney przypomina zaczarowaną dżunglę z gigantyczną wyspą słoni i wieloma małymi słoniami wykonującymi różne czynności. Jednak w wersji Midjourney brakuje centralnego elementu „nadwymiarowego motyla”.

Płaska konstrukcja

Podpowiedź: minimalistyczna pocztówka przedstawiająca esencję Tokio poprzez kultowe sylwetki, takie jak Tokyo Tower, rolka sushi i gałązka kwiatu wiśni

Obydwa zdjęcia oddają esencję Tokio za pomocą Tokyo Tower, sushi i kwiatów wiśni. Wersja Dall-E 3 jest żywa, przedstawia szczegółowy pejzaż miejski i rolkę sushi na jasnym tle, a kwiaty wiśni są bujne.

Natomiast Midjourney charakteryzuje się spokojnym i minimalistycznym podejściem, z pastelową paletą, uproszczonymi strukturami i mniejszą ilością kwiatów wiśni.

Chociaż oba dzieła zawierają wymagane elementy, Dall-E 3 dodaje dodatkowe funkcje, takie jak rzeka i most. Pod względem jakości obraz Dall-E jest bogatszy w szczegóły, podczas gdy Midjourney kładzie nacisk na prostotę i otwartą przestrzeń.

Rendery 3D

Podpowiedź: szczegółowy, trójwymiarowy wisiorek z jadeitowym smokiem i rubinowymi oczami, zawieszony na delikatnym srebrnym łańcuszku na aksamitnym tle

Wisior Dall-E (po lewej) bardzo pasuje do wyglądu „jadeitu” ze względu na zielony kolor i rubinowe oczy, ale srebrny łańcuszek wydaje się grubszy, niż oczekiwano. Tło wygląda jak aksamit.

Wisiorek Midjourney (po prawej) nie wygląda tak bardzo jak jadeit i ma bardziej metaliczny wygląd, ale jego rubinowe oczy są widoczne. Łańcuch jest tutaj bardziej szczegółowy, a tło jest zwyczajnie ciemne. W porównaniu z podpowiedzią obraz Dall-E lepiej komponuje się z detalami „jadeitowego” i „aksamitnego tła”, podczas gdy Midjourney podkreśla aspekt „srebrnego łańcuszka”.

Ilustracja cyfrowa

Podpowiedź: cyfrowa ilustracja psotnego kota próbującego przemycić rybę z miski, podczas gdy znajdująca się w pobliżu papuga krzyczy ostrzeżenie

Obydwa zdjęcia przedstawiają kota próbującego wyciągnąć rybę z miski, a w pobliżu znajduje się papuga. Zdjęcie Dall-E 3 po lewej stronie przedstawia kota w szare paski spokojnie dotykającego wody, a papuga po prostu patrzy.

Na zdjęciu w trakcie podróży po prawej stronie kot wygląda na zaskoczonego i nie ma papugi. Zdjęcie Dall-E ma więcej szczegółów i tekstur, dzięki czemu wygląda na bardziej dopracowane. Obraz Midjourney sprawia wrażenie pośpiesznego i ma ciemniejszą scenerię z brakującymi elementami.

Obraz olejny

Podpowiedź: Zamyślony marynarz uroczysty, trzymający stary kompas, na tle wzburzonego morza i burzowych chmur

Zdjęcie po lewej stronie, wykonane przez Dall-E 3, przedstawia starszego marynarza zamyślonego, a za nim wzburzone morze. Prawa, autorstwa Midjourney, przedstawia młodszego marynarza spoglądającego na spokojniejsze morze. Obydwa zdjęcia pasują do podpowiedzi, ale Dall-E wydaje się bliższy ze względu na bardziej burzliwe tło. Jakość obrazu w obu przypadkach jest dobra, ale dają różne odczucia: jeden ma ochotę spojrzeć wstecz na przeszłe przygody, a drugi ma ochotę przygotowywać się na nową.

Diorama

Podpowiedź: Miniaturowa scena karnawałowa z działającym diabelskim młynem, małymi gośćmi delektującymi się watą cukrową i klaunem żonglującym świecącymi kulami w stylu dioramy

Obydwa obrazy przedstawiają miniaturowe sceny karnawału z diabelskimi młynami. Zdjęcie po lewej stronie, autorstwa Dall-E 3, przedstawia gości z watą cukrową i klaunem żonglującym świecącymi kulami, co dobrze pasuje do podpowiedzi. Odpowiedni obraz autorstwa Midjourney ma charakter nocny i ma bardziej złożone projekty, ale nie przedstawia gości z watą cukrową ani żonglerskim klaunem. Chociaż oba obrazy są dobrej jakości, obraz Dall-E jest bardziej zbliżony do specyfiki podpowiedzi, podczas gdy obraz Midjourney oferuje wyjątkowe ujęcie, ale mali goście nie są tak wyraźni.

Architektura

Podpowiedź: Fantazyjna biblioteka w domku na drzewie ze kręconymi schodami, wiszącymi latarniami i balkonami wypełnionymi książkami

Lewy obraz autorstwa Dall-E 3 jest bardziej fantastyczny, z wieloma szczegółami, latarniami i większym domkiem na drzewie. Właściwy obraz Midjourney wydaje się bliższy prawdziwemu życiu, z mniejszą liczbą pokoi i latarni. Obydwa zdjęcia przedstawiają ideę „biblioteki w domku na drzewie” ze spiralnymi schodami i balkonami na książki. Oboje dobrze podążają za wskazówkami.

Jednakże zdjęcie Dall-E ma bardziej marzycielski charakter dzięki zielonkawej poświacie, podczas gdy zdjęcie Midjourney wydaje się rozgrywać wieczorem i jest bardziej przytulne.

Obydwa obrazy są wysokiej jakości, ale wybór między nimi polega na tym, czy wolisz bardziej magiczny, czy realistyczny wygląd.

Projektowanie wnętrz

Podpowiedź: artystyczna sypialnia z łóżkiem w kształcie hamaka, gobelinami na ścianach, mozaikowym lustrem i roślinami zwisającymi z sufitu

Obydwa obrazy oddają atmosferę artystycznej sypialni. Obraz Dall-E (po lewej) jest kolorowy i ma wzory, ma siedzisko przypominające hamak, przezroczyste gobeliny i wiele wiszących roślin, ale brakuje mu mozaikowego lustra.

Obraz Midjourney (po prawej) jest jaśniejszy i bardziej przestronny, z roślinami i koronkowym gobelinem, ale jego łóżko nie jest w stylu hamaka i nie ma widocznego mozaikowego lustra.

Chociaż oba obrazy zawierają elementy boho i wiszące rośliny, żaden z nich w pełni nie pasuje do podpowiedzi, zwłaszcza jeśli chodzi o mozaikowe lustro i dokładny opis łóżka hamakowego.

Podpowiedzi o wysokim kontekście

Podpowiedź: Warsztat kowalski w epoce renesansu ze szczegółowymi narzędziami, świecącą kuźnią, misternymi elementami zbroi i rzemieślnikiem przy pracy

Lewy Dall-E ma jednego kowala, starannie zorganizowane narzędzia i podświetloną zbroję. Właściwy od Midjourney ma wielu ludzi, rozproszone narzędzia i żywą atmosferę. Chociaż oba przedstawiają warsztat, zdjęcie Dall-E skupia się na pojedynczym rzemieślniku i jego narzędziach, a zdjęcie w trakcie podróży bardziej przypomina pracowity dzień z wieloma pracownikami.

Monity o niskim kontekście

Podpowiedź: Taniec w świetle księżyca

Obydwa obrazy przedstawiają „taniec w świetle księżyca”. Zdjęcie po lewej stronie autorstwa Dall-E ma żywy niebieski odcień, przedstawiające sylwetki tancerzy na tle wielkiego księżyca, natomiast zdjęcie Midjourney po prawej stronie oferuje bliższe i bardziej szczegółowe spojrzenie na tancerzy przy subtelniejszej poświacie księżyca. Dall-E skupia się na otoczeniu i kontrastach, a Midjourney podkreśla emocje tancerzy. Obydwa oddają motyw tańca w świetle księżyca, ale w różnych stylach.

Gwiazda show: Midjourney kontra Dall-E 3

Po ocenie 16 obrazów wygenerowanych przez sztuczną inteligencję z Dall-E 3 i Midjourney stało się oczywiste, że Dall-E 3 przoduje w rejestrowaniu skomplikowanych szczegółów. Platforma ta przewyższa także Midjourney w interpretacji intencji podpowiedzi w celu wygenerowania odpowiednich obrazów. Z drugiej strony Midjourney ma przewagę w tworzeniu efektów wizualnych, które wyglądają realistycznie. Chociaż Dall-E 3 dąży do perfekcji, czasami może generować mniej naturalne obrazy.

Dla firm poszukujących szczegółów w wizualizacjach AI, Dall-E 3 może być bardziej odpowiednim wyborem. Będziesz mógł uzyskać do niego dostęp za pośrednictwem ChatGPT Plus, a już wkrótce także w Photosonic, najlepszym generatorze obrazów AI. OpenAI planuje wkrótce udostępnić interfejs API Dall-E 3, dzięki czemu stanie się on zintegrowaną funkcją programu Photosonic.

Często zadawane pytania

1. Czy Midjourney jest lepszy od DALL-E 3?

Tak naprawdę nie chodzi o to, że jeden jest wprost „lepszy” od drugiego. Mają różne style i możliwości. DALL-E 3 jest zintegrowany z ChatGPT Plus i stanowi część pakietu otrzymywanego z GPT-4. Z drugiej strony Midjourney może oferować różne warianty renderowania. Tu raczej chodzi o Twoje osobiste preferencje i styl, jakiego szukasz.

2. Czy DALL-E 3 jest darmowy?

Nie, DALL-E 3 nie jest darmowy. Jest dołączony do ChatGPT Plus, który kosztuje 20 USD miesięcznie. Ta subskrypcja zapewnia również dostęp do GPT-4.

3. Co jest tańsze, DALL-E 3 czy Midjourney?

Patrząc ściśle na liczby, Midjourney zaczyna się od niższej ceny 10 USD miesięcznie. DALL-E 3 jest wyposażony w ChatGPT Plus, którego cena wynosi 20 USD miesięcznie. Jeśli więc budżet jest kluczowym czynnikiem, Midjourney może być bardziej opłacalną opcją.