Свободно време

Как да рисуваме с Midjourney AI

Изкуственият интелект позволява да създавате собствени уникални произведения на изкуството

Робърт Христов

Midjourney AI © Робърт Христов

Капитал: Light

Всяка събота сутрин: култура, изкуство, свободно време.

Темата накратко

Изкуството с инструменти, които използват изкуствен интелект напредва все повече и става много по-достъпно
Midjourney е независим AI арт генератор, който превръща текст описания в изображения. Всичко, което трябва да направите, за да започнете е да въведете няколко думи
Детайлно ръководство с примери за възможностите, които Midjourney предоставя.

Ако сте решили да се докоснете до възможностите за генериране на изображения, които изкуственият интелект предоставя, но не знаете от къде да започнете, в тази статия ще разгледаме един от най-използваните инструменти за това-Midjourney AI. Какво точно е Мидджърни обаче? Това на практика е Discord бот, който ви позволява да реализирате най-смелите си артистични мечти и да интегрирате по-забавни AI идеи в ежедневието, а и бизнеса си!

За да направите първата си AI картина, първо ви трябва регистрация в платформата Discord, тъй като Midjourney не се инсталира и не работи в браузър. Той ще позволи да рисувате дори през телефона си. След регистрация в Discord трябва да влезете в правилния сървър - може да се намери на официалния сайт на Midjourney.com или като натиснете зеления "+" (добавяне на сървър) в платформата, а за покана трябва да напишете (midjourney). След като вече сте в сървъра, ще последва кратка автентикация, в която ще имате възможност да видите всички канали. Не се притеснявайте, ако това е първият ви дискорд, изглежда много по-сложно отколкото е!

Вече е време да направим първата си картинка. За целта в полето отляво трябва да кликнем един от #newbies, без значение какво е неговото число. В текст чата въвеждаме наклонена черта (/imagine), по този начин ще започва всяко наше генериране на картина. След това ще напишем описание на картината, която си представяме. За целите на статията ще използваме просто описание, което ще развием, като разгледаме всички възможности на Midjourney, а целта е в края, след като опитате всичко, за което сме говорили, да отключите всички възможности на този AI, за да нямате никакви граници.

Да започнем с едно сладко коте

Пишем /imagine cute cat и изчакваме резултатите. Когато са готови, ще видите нещо подобно. Междувременно, докато ги чакате, не се притеснявайте от множеството хора, които генерират картинки в #newbies чата.

Виждаме, че вместо едно, вече имаме 4 сладки котета. Под снимките U1, U2, U3 и U4 се използват съответно за ъпскейлване (увеличаване на размера, качеството и големината на файла на съответна картина, която ние изберем). В случая, ако натиснем U2, след кратко изчакване, ще получим по-голям файл на котето отдясно на първия ред, а ако натиснем U3, на това отляво на втория. Другите възможности, които ни се откриват, са да правим вариации на избрано изображение. В случая с V1, V2, V3 и V4 ще генерираме изображения много подобни на това, което сме избрали. Аз лично харесвам картинката на горния ред вляво (първата), затова натискам V1.

С получения резултат, макар и с минимални разлики от първата картинка, на нас отново ни се предоставят опции да увеличим с U (1-4) или да създадем нови вариации с V (1-4).

С увеличаването на описанието получените резултати се подобряват до получаването на желания ефект. Например, ако искам вместо "сладко коте" да генерирам картинка на "зелено сладко коте, което пие мляко докато инвестира в биткойн", достатъчно е да напиша (/imagine ) и описанието. Полученият резултат за мен изглежда така, а интересното в "Мидджърни" тепърва започва.

Всичко зависи от правилното описание - както виждаме от примера, не съм уточнил, че искам само котето да е зелено, а млякото не. Освен това, по нищо не си личи, че котето е криптоинвеститор, затова трябва да допълня с повече ключови думи или да използвам други опции, с които да дам информация за начина, по който си представям изображението, за да може AI да го направи за мен. Най-лесният начин е да имате запазена снимка, която да пратите в чата. Това може да стане с drag&drop, с copy/paste или с малкия "+" до чат бокса, след което (качване на файл). За пример ще взема от shutterstock картинка на биткойн и ще я кача в чата. Докато го правя, ще ъпскейлна (направя по-голяма) с U2 втората картинка.

Сега ще поискам AI да комбинира 2 изображения (това на зеленото коте и това на биткойна), като за целта напиша (/imagine), след което придърпам снимките в чат бокса. Това работи и за почти всички линкове на изображения, така че ако искате да си спестите качването на снимката в дискорд, може директно да копирате и поставяте линкове към изображения. Винаги линковете са първи, след което е време за описанието, а както ще научим малко по-късно, след описанието са параметрите.

Така, сега, след като вече съм написал (/imagine) и съм дропнал линковете към снимките, ако натисна enter, АI ще ги комбинира произволно, но за постигането на по-добри резултати е хубаво след снимките да се добави описание, дори ако то е еднакво с едно от тези, които сме използвали преди това. Аз например ще използвам (green cute kitten drinking milk while investing in bitcoin). Сега описанието ми ще изглежда така:

Вече става време за параметри и допълнителни функции. Те се пишат след описанието, а за да ги вкарате в употреба, трябва да използвате 2 тирета последователно (--).Функциите са следните:

Големина

С (--aspect ) можем да контролираме големината на файловете, които искаме да получим като резултат. Тук става въпрос за параметри на височина и широчина, като например 2:3 за портрет, 1:1 за квадрат (това е функцията по подразбиране), 3:2 и 7:4 за широки картини и т.н. Прост пример, който няма да показваме отделно, би бил, ако искаме котето да е в портретен формат, бихме написали (/imagine cute cat --aspect 2:3).

Различие на получените резултати

С (--Chaos) можем да контролираме колко си приличат получените първоначално 4 версии. По подразбиране

(--chaos) e 0, затова и резултатите са много сходни. Аз обичам да разглеждам и оценявам изключително различни резултати, затова винаги прилагам висок (--chaos), като например --chaos 25, --chaos 50, но най-вече --chaos 100, така си подсигурявам резултати като от 4 търсения едновременно, а ако нещо ми хареса, го ъпскейлвам и използвам като база (както направихме с картинката с биткойна).

Kaчество

С (--quality) контролираме качеството на желаните изображения.Колкото по-високо е качеството, толкова по-бавно се генерират изображенията. Минималното качество е (--quality .25) след което следват (--quality .5/1 и максималното 2).

Стил

С (--stylize) контролираме детайлите в генерираните от нас изображения. Отново, колкото по-високо е качеството, толкова по-бавно се генерират изображенията и когато става дума за платената версия на Midjourney, по-детайлните изображения, биват таксувани повече. По подразбиране Midjourney работи с (--stylize 100), други възможности са (--stylize 50, 250, 750). В примера (--stylize 750) ще бъде най-високото възможно качество.

Версия

Midjourney рутинно пуска нови версии на AI модели за подобряване на ефективността, съгласуваността и качеството. Най-новият модел винаги е по подразбиране, но другите модели могат да се използват с помощта на параметъра (--version) или чрез използване на командата /settings и избиране на версия на модела. Различните модели се отличават с различни видове изображения. Командата (--hd) също се смята за версия, но не може да се достъпи с най-новия модел на Midjourney (version 4), затова ако искате да го изпробвате с по-стара версия, например 3, която мислите, че би изглеждала по-добре, командата ще бъде (/imagine (възможност за снимки)(възможност за описание)(възможност за други параметри) --version 3 --hd).

Примерите за други версии изглеждат така:

Модел Niji

Моделът Niji е сътрудничество между Midjourney и Spellbrush и е настроен да произвежда аниме и илюстративни стилове. С командата (--niji) гарантирате повече възможности за аниме, аниме стилове и анимирана естетика. Най-често се използва за динамични и екшън снимки и фокусирани върху герои композиции.

С (--video) може да създавате кратко видео съдържание по същия начин, по който създавате картини. Просто следвайте модела (/imagine (снимки, ако ще качвате такива)(описание, ако ще имате такова)(други параметри) --video)

Лимитира ви единствено собствената ви креативност

Това са много повече от базисни познания, които ако опитате и започнете да използвате, ще ви позволят сами да навлезете в детайлите за използване на Midjourney. Все пак, да се върнем на нашето коте и да използваме наученото, за да генерираме възможно най-добро изображение за статията. За целта ще използвам 2 бази - една с биткойн изображение и още една допълнителна, която да ми предостави повече възможности. След базите, следва време за описанието, което ще променя и удължа. Последното са параметрите. Илюстрацията трябва да бъде широка, тоест ще използвам (--aspect 3:2), искам повече различни версии, ще използвам (--chaos 100) и по-високо качество (--stylize 500). Разбира се, примерът с котето беше единствено за да задържи интереса и да предостави достатъчно достъпно съдържанието, защото за изображения, генерирани от AI ви лимитира единствено собствената ви креативност. Може да направите всичко, което можете и да си представите!

Избраната от мен версия ще уголемя повторно с друг AI инструмент, който да увеличи допълнително качеството -Upscale.media. За момента Midjourney предлага trial на всички възможности от около 30-40 изображения, след което плановете варират от 8 до 48 долара на месец.