首頁 > 綜合 > 正文

從0-1,帶你深究MJ中Prompt描述細節(jié) 環(huán)球觀天下

2023-04-27 09:12:06來源:人人都是產(chǎn)品經(jīng)理  

在Midjourney的使用過程中,除了需要了解如何設(shè)置參數(shù),prompt提示也是使用Midjourney過程中必然涉及的一個因素。在本篇文章里,作者便結(jié)合案例,對如何在Midjourney中做好prompt提示進行了總結(jié),一起來看。


(相關(guān)資料圖)

前言

在上一篇文章中我們主要了解關(guān)于Midjourney中的絕大部分我們能夠使用到的參數(shù)的內(nèi)容,我相信如果你能夠合理的運用了參數(shù),圖片質(zhì)量將提升一大截;那么在這一篇文章中我們來研究關(guān)于MIdjourney中最為和核心的一個內(nèi)容: prompt ,我將以官方手冊為基礎(chǔ)帶你更為深入的了解MJ中的這一部分內(nèi)容(大量代練案例,直接融會貫通)。

在Midjoureny中最基本的提示包括 一個或多個圖像URl、多個文本短語,以及一個或多個參數(shù) 組成;本來是想先將最為重要的文本描述講清楚,但想了想還是按照最為合理的順序,依次從圖片描述、文本描述、參數(shù)展開。

一、你需要了解的(圖片提示)基本信息

圖片提示可以作為提示的一部分,他將會影響 構(gòu)圖,風(fēng)格,和顏色 ;需要注意如果添加圖片提示需要圖片放置文本提示之前,分為圖片+圖片提示和圖片+文本提示,這樣才能工作,單張圖片不行哦~

1. 上傳圖片的兩種形式

點擊“+”號上傳;拖拽圖片上傳;兩種方式均可,記得上傳之后點回車鍵。

2. 添加圖片URL的兩種形式

第一種形式是最為常見的形式,點擊圖片后在瀏覽器中打開,然后點擊復(fù)制鏈接,但非常推薦第二種形式,上傳圖片后直接鼠標(biāo)點擊圖片不放下拉至Prompt框就好啦!

需要注意的就是需要檢查圖片的URL鏈接結(jié)尾是以: JPG、PNG、GIF ,結(jié)尾。

以及這是上一篇文章中做的一個圖片權(quán)重參數(shù)值對于結(jié)果的影響的嘗試,有興趣的可以跳轉(zhuǎn)瀏覽。

二、文本描述

隨著MJ的爆火,逐漸有非常多的網(wǎng)友分享自己的“咒語”,我們只需要cotry+C+V就好,但發(fā)現(xiàn)咒語收藏了很多,但實際使用的結(jié)果卻差強人意;其實你可能不知道的是,別人出一張圖背后可能是有上百張的廢稿,文本順序的細節(jié)變化,墊圖的內(nèi)容,參數(shù)的微小調(diào)整…都會對結(jié)果產(chǎn)生不同的影響,所以我們不要關(guān)注咒語本身,嘗試著制造自己的咒語!

文本提示是本文最著重的環(huán)節(jié),同樣也是MJ中最重要的出圖邏輯,文本的描述涉及的內(nèi)容or問題較多,變數(shù)也比較大,例如提示邏輯和文本長度,語法,細節(jié)描述…等等,讓我們依次來梳理~

1. 你必須了解的(文本提示)基本信息

文本提示是MJ最基礎(chǔ)最重要的一個功能, MJ bot將提示中的單詞或詞組分解為一個個的部分,然后與后臺訓(xùn)練的數(shù)據(jù)庫進行對比比較,在然后生成圖像 ;在文本提示里,你可以通過很簡單的單詞甚至一個emoji就能夠得到超乎意料的結(jié)果(但非常少的提示得到結(jié)果也將非常藝術(shù)化具有很大的隨機性),當(dāng)然你也可以通過更為細節(jié)的描述得到符合自己要求的內(nèi)容;下面我們就著重深究。

2. 文本順序?qū)τ诮Y(jié)果的影響

首先,文本的順序到底有什么考究?我們?nèi)绾瓮ㄟ^順序去調(diào)整畫面呢?

在我們?nèi)粘K⒍桃曨l時能夠常??匆娪袩嵝牡木W(wǎng)友分享關(guān)于寫Prompt的基本邏輯,但內(nèi)容順序和方法各有特色,為了絕對的可靠咱們還是以官方的建議為標(biāo)準(zhǔn): 主題+媒介+環(huán)境+照明+顏色+情緒+構(gòu)圖。

總的來說: 主體內(nèi)容、背景環(huán)境、構(gòu)圖視角,風(fēng)格和其他要求(顏色,氛圍,構(gòu)圖)描述。

但是,官方的一個書寫邏輯是一個范本,我們可以完全遵循他的一個順序,也可以適當(dāng)?shù)挠兴〉恼{(diào)整;例如:以下是我編輯好的一段關(guān)于以勞動者為主題的完整的文本描述(基本是按照官方的一個推薦順序書寫的)。

實際得到的結(jié)果是這樣的,畫面確實不錯,但是我不想這么寫實,想要卡通一點,有點像迪士尼那種3D人物角色的感覺;于是,我把3D、迪士尼、皮克斯風(fēng)格,等相關(guān)的關(guān)鍵詞提前,以此來提高其權(quán)重,如圖,整體得到的結(jié)果已經(jīng)有非常大的改變,為了確定穩(wěn)定性,我接連出了很多張,風(fēng)格基本都能夠固定。

再接著,我覺得畫面的氛圍感不夠,那么如何增加呢?設(shè)想一個木匠,在工作室中工作,那一定是木屑會滿天飛,這個效果對于氛圍感是一大助力,其實在前面的文本中也有描述木屑飛揚,但是由于太居后,權(quán)重比較低,于是乎,將它提前,效果簡直顯而易見!

(但是這也又慢慢出現(xiàn)一個新的問題,隨著我將一些詞提前,畫面內(nèi)容逐漸靠后,MJ在年齡的設(shè)定上逐漸模糊,開始出現(xiàn)不同年齡階段的人物,所以對于把想要的內(nèi)容前置記得適可而止,提高其他1權(quán)重必定會相應(yīng)降低2權(quán)重)

關(guān)于給關(guān)鍵詞提升權(quán)重,其實官方也有介紹,在相關(guān)關(guān)鍵詞后面的加上提示(::1 ::2 ::X)也可以提高其權(quán)重,但是之所以本篇文章是通過順序的調(diào)整來提高文本權(quán)重,是因為當(dāng)你在使用多提示作為詞與詞之間的區(qū)分時,機器會默認給你的區(qū)分詞前面加上“1”的權(quán)重(非指定權(quán)重默認為1),如果你給一個詞使用多提示符號,又想給其他詞增加權(quán)重那數(shù)字一定要大于1,否則兩個詞的權(quán)重將相等(如下圖案例),以及需要額外思考規(guī)避權(quán)重歸一化的問題。我提供的也是我的一個新的思路點,方法千萬條,如果你的需求比較繁雜,不妨兩個方法一起使用,能達到最終的結(jié)果都是好方法

官方的一個例子:

hot:: dog 和 hot::1 dog – hot:: dog::1相等;cup:: cake:: illustration 和 cup::1 cake::1 illustration::1 – cup::1 cake:: illustration:: – cup::2 cake::2 illustration::2 相等

(不過非常推薦在負權(quán)重中使用“負提示”比較好用)

三、關(guān)于書寫文本描述的一些小建議

1. 關(guān)于prompt的內(nèi)容長短

MJ的生圖邏輯是通過提示中的單詞或者短語分解成一個個小的部分,與數(shù)據(jù)庫中的訓(xùn)練的數(shù)據(jù)進行對比,然后生成圖像;所以在描述時表達自自己需要的內(nèi)容即可,對于不想要的內(nèi)容不必單獨闡述:“我不想在畫面中看見“花瓶”,畫面中沒有籃球等等”;如果你描述了一個臥室的場景,bot自由發(fā)揮出了一些你不需要的內(nèi)容,你可以使用負權(quán)重“– no”來刪除;像這樣有效的描述也在一定程度上能夠精簡文本的內(nèi)容。

在很多網(wǎng)友的prompt的分享中,我們會看見很長的一大串的英文提示詞,仔細查看會發(fā)現(xiàn)很多相近詞、氛圍詞,或冗長的主體描述,此舉到底對不對呢,我們來看看官方的解釋: Mj bot不像人類一樣能夠理解語法、句子結(jié)構(gòu)或單詞; 更少的詞意味著每一個詞都能有更大的權(quán)重 ,當(dāng)你添加過多繁雜描述,越后的描述詞比重就被逐漸稀釋甚至貨不對板。

2. 學(xué)會加限定詞

比如在這一組圖中,雖然整體感覺都還不錯,但是有一個缺點,里面的人物各不相同,比如在年齡上,穿著上,這個時候我們就可以適當(dāng)加上一些補充表述,或者說是限定詞,比如:30歲,西裝。

(但有一點非常重要,很多人喜歡加一些像安慰劑一樣的詞,比如4K 8K,非常高的細節(jié),超高質(zhì)量內(nèi)容,清晰度等等,這有用嗎?一定程度上是有的,但別過度使用,如果你有背景虛化的描述,又說高清晰度,這不就起沖突么~)

3. 內(nèi)容描述具體

想要的內(nèi)容清楚描述,你當(dāng)然可以含糊其辭,但獲得內(nèi)容的將多樣化隨機化,無法獲得你想要的具體細節(jié)。

(比如:你說“一只貓”會比“貓”更為具體;或你想描述臥室一角,你說這是一個溫馨的臥室,有花瓶,有床頭柜,有窗簾,這樣當(dāng)然可以,給與bot充分的發(fā)揮空間,沒準(zhǔn)也能夠收獲驚喜;但如果心里沒譜,不妨嘗試這樣描述:這是一個溫馨的臥室,深棕色的床頭柜上擺放著精致水晶玻璃花瓶,花瓶里面插入著五朵香檳玫瑰,背景是垂落的窗簾~……其實這也變相的給內(nèi)容增加了一些限制,和上一p一樣~)

4. 使用更為專業(yè)的詞語

MJ并不像CharGPT那么聰明也絕沒有那么笨,當(dāng)你在描述內(nèi)容中,你需要背景虛化的效果,直接說背景需要也是ok的,但是你要是說出: 光圈F2.0 ,尼康 ,那就更為準(zhǔn)確,可以通過關(guān)鍵詞的改變來調(diào)整背景虛化度呢~

四、參數(shù)、參數(shù)、參數(shù)

默認參數(shù),在setting設(shè)置中勾選相應(yīng)的內(nèi)容即可將相應(yīng)的參數(shù)調(diào)為默認狀態(tài),主要包括:版本(V5),質(zhì)量(q),風(fēng)格化值(s)(圖)橫寬比則需要單獨描述,所以參數(shù)這個環(huán)節(jié)在順序上沒有特別的要求,會默認排列,根據(jù)自己的需求設(shè)定合適的參數(shù)范圍即可;還有一個小細節(jié)需要注意:當(dāng)你必須添加一個參數(shù)時,前后之間記得敲上空格,不然會報錯哦。

(注意每個參數(shù)在不同的版本之間都有不同的數(shù)值對比的,詳情可看上一篇文章)

五、需要避開的違禁提示

AIGC產(chǎn)出內(nèi)容要價值觀!哈哈哈絕對正能量,在符合discord平臺的要求的同時也多多注意中國相關(guān)的AIGC的政策要求。

在使用Prompt中,需要注意提示禁忌;在使用圖片提示時稍微注意即可,注意圖片的內(nèi)容,不要開車搞顏色;但在在使用文本提示時需要額外注意,由于大家基本使用的方式都是通過中文描述后使用翻譯復(fù)制黏貼過去,有意無意會出現(xiàn)我們也不知道的英文違禁詞,例如當(dāng)你使用”蜜桃“時,在英文中俚語和pp相同,所以機器可能會以為你在搞顏色,會警告的哦~

所以咱們要滿滿的正能量,內(nèi)容描述常規(guī)不搞事情(在鏡頭,構(gòu)圖視角上隨便來)。

六、最后

恭喜你閱讀完了全文,最后我做一個小小的總結(jié),本篇主要講解了關(guān)于Midjourney中最為核心和主要的部分,分別為圖片描述、文本描述、和參數(shù),以及附帶了一點點關(guān)于違禁詞的注意事項,比較細節(jié)的介紹了關(guān)于相關(guān)內(nèi)容的使用方式,希望你瀏覽過本文之后在看見別人的咒語后可以copy下來好好研究一下,無腦復(fù)制一時爽,自己做時手忙腳亂(強行不押韻),更多的希望研究背后別人的搭建邏輯, 不做麻瓜,做道長!

如果你也對AIGC相關(guān)內(nèi)容歡迎關(guān)注與我交流~

本文由 @元旦AIGC 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash ,基于 CC0 協(xié)議

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

標(biāo)簽:

相關(guān)閱讀

精彩推薦

相關(guān)詞

推薦閱讀