精品精品国产手机自在线观|九九热思思精品视频|中文字幕aⅴ专区|黄国产成年人精品

    當(dāng)前位置:區(qū)塊鏈 >區(qū)塊鏈 > Midjourney V6神圖炸出!生圖效果碾壓DALL·E3,逼真畫(huà)面光影細(xì)節(jié)登峰造極

    Midjourney V6神圖炸出!生圖效果碾壓DALL·E3,逼真畫(huà)面光影細(xì)節(jié)登峰造極

    更新時(shí)間:2023-12-22 16:04:02 | 作者:佚名
    兵貴神速,MidjourneyV6昨天上午說(shuō)要來(lái),下午就真來(lái)了。神圖紛紛炸出,光影效果登峰造極,主打一個(gè)「你能說(shuō)我就能畫(huà)」,擅長(zhǎng)寫(xiě)Prompt的朋友,你們有福了! 原文來(lái)源:新智元 圖片來(lái)源:由無(wú)界AI生成 猝不及防的,MidjourneyV6昨天下午忽然發(fā)布了! 雖然已經(jīng)預(yù)告了是這兩天,但誰(shuí)也沒(méi)想到Midjourney的手速居然這么快,趕在圣誕節(jié)前讓大家...
    兵貴神速,Midjourney V6昨天上午說(shuō)要來(lái),下午就真來(lái)了。神圖紛紛炸出,光影效果登峰造極,主打一個(gè)「你能說(shuō)我就能畫(huà)」,擅長(zhǎng)寫(xiě)Prompt的朋友,你們有福了!

    原文來(lái)源:新智元

    圖片來(lái)源:由無(wú)界 AI生成

    猝不及防的,Midjourney V6昨天下午忽然發(fā)布了!

    雖然已經(jīng)預(yù)告了是這兩天,但誰(shuí)也沒(méi)想到Midjourney的手速居然這么快,趕在圣誕節(jié)前讓大家嘗嘗鮮。

    在/settings的下拉菜單中選擇V6,或者在Prompt后輸入 --v 6,就可以用上V6 Beta版模型了!

    激動(dòng)的網(wǎng)友們蜂擁而入,出爐了一大波測(cè)評(píng)。比起V5,V6真的是瘋狂加細(xì)節(jié),畫(huà)面質(zhì)量史詩(shī)級(jí)增強(qiáng)。

    根據(jù)MJ官方介紹,V6的主要變化,就是圖像質(zhì)量更好、語(yǔ)義理解更強(qiáng)、能嵌入英文單詞、更容納更多token了。

    舉個(gè)例子,下面這兩張超人和蝙蝠俠的「劇照」,要不是背景里的「V6 is here」的提示,幾乎已經(jīng)分辨不出來(lái)到底是實(shí)拍還是出自AI。

    以前被詬病最多的「一眼AI」,也在V6上達(dá)到了幾乎「以AI亂真」的地步。

    有網(wǎng)友表示:Midjourney V5到V6的升級(jí),堪稱是一次里程碑,意義堪比Stable Diffusion出現(xiàn)高清重繪。

    除了圖像模型的大提升之外,V6最大的變化,就在于提示詞系統(tǒng)幾乎重做了。

    用戶很可能需要重新學(xué)習(xí)怎么寫(xiě)提示詞,需要盡量避免之前「語(yǔ)焉不詳?shù)拿枋觥?,例如「award winning」這類形容詞。

    之所以會(huì)這樣,是因?yàn)樵谝郧?,模型沒(méi)辦法完全反映提示詞的要求,寫(xiě)太詳細(xì)也沒(méi)用。但是升級(jí)之后,圖片會(huì)盡可能地遵循提示詞中每一個(gè)詞,所以用戶也要珍惜提示詞的空間,盡可能地詳細(xì)描述自己想要的內(nèi)容。

    總之一句話就是,「只要你能說(shuō)得清楚,V6就能給你畫(huà)明白?!?/p>

    網(wǎng)友用Midjourney V6來(lái)想象「如果史蒂夫·喬布斯今天還活著,他會(huì)是什么樣子」,結(jié)果令人震驚這位網(wǎng)友表示:如果說(shuō)這是生成式AI創(chuàng)造的圖像,沒(méi)人會(huì)相信我。

    它已經(jīng)達(dá)到了電影級(jí)別的質(zhì)量。這一領(lǐng)域的創(chuàng)意,比如電影、照片、海報(bào)和雜志,從此很可能由AI主導(dǎo)。

    另一位網(wǎng)友表示,MJ V6太逼真了,你可以直接用它想象你最愛(ài)的演員在電影中的樣子,比如Jared Leto在Netflix《最后的沙皇》中的扮相。


    神圖紛紛出現(xiàn),圖像質(zhì)量史詩(shī)級(jí)提升


    里程碑級(jí)的升級(jí),究竟體現(xiàn)在了哪些地方?

    一位網(wǎng)友用同樣的Prompt來(lái)測(cè)試了V6和V5.2,可以看出,V6的提升體現(xiàn)在多處細(xì)節(jié)上。(上V6,下V5.2)

    雨坑中日落的倒影,V6的光影效果明顯比V5.2更自然,V5.2的加工痕跡要更明顯。

    reflection of a sunset in a rain puddle

    仔細(xì)觀看可以發(fā)現(xiàn),同樣的女性面部主體,V6在皮膚細(xì)節(jié)、毛發(fā)細(xì)節(jié)、光影效果上,都遠(yuǎn)優(yōu)于V5.2的效果。

    1940年代復(fù)古科幻電影中身穿高領(lǐng)銀色操作衣的女操作員,V6生圖明顯要比V5.2更加真實(shí)。

    V5.2的圖片主體人物顯得過(guò)于呆板,不像真人。

    1940s retro sci-fi film, medium side-angle shot of a young female control panel operator wearing a form-fitting silver jumpsuit with a high collar. She is surrounded by 3 art deco robots. warm glowing buttons and switches, soft illumination

    下面這兩幅食物的圖片都很誘人,但是V6的色彩和光影還是要更勝一籌。

    a pot of stew with a wooden spoon, top-down perspective

    在生成「二次元」風(fēng)格的口袋妖怪時(shí),V6生成的效果神似動(dòng)漫,而V5.2會(huì)畫(huà)得更像個(gè)擺拍的手辦。

    frozen squirtle on the top of a snowy mountain 35mm film still of a detective


    超強(qiáng)語(yǔ)義理解,Prompt說(shuō)啥就畫(huà)啥


    如果說(shuō)在以前,視覺(jué)效果和美學(xué)表現(xiàn)都足夠震撼的Midjourney,為何風(fēng)頭時(shí)常不及DALL-E 3和Adobe Firefly,那自然是因?yàn)閷?duì)于Prompt的高要求,嚇退了眾多「語(yǔ)死早」的用戶。

    并且,V5.2糟糕的語(yǔ)義理解,也經(jīng)常讓生圖結(jié)果是「雖然美麗但不實(shí)用」。

    而如今的V6,讓Midjourney對(duì)于語(yǔ)氣增強(qiáng)的理解,終于追上了競(jìng)家的腳步。比起V5.2,V6大大增強(qiáng)了語(yǔ)義理解的能力,對(duì)于Prompt的把握也更加精準(zhǔn)。

    寫(xiě)著「open late」霓虹燈標(biāo)志的酒吧,V6就原樣生出來(lái)了,V5.2的字樣根本就不對(duì)。

    而且從光影效果來(lái)看,V6也要更豐富更真實(shí),就像給圖片開(kāi)了光追一樣。

    a corner bar with a neon sign that says "open late"

    這張1960年代的街頭風(fēng)格照片,需要畫(huà)出一位年輕女子穿著綠色絲綢連衣裙、戴著珍珠項(xiàng)鏈坐在帆船上。

    顯然,V6對(duì)于「珍珠項(xiàng)鏈」的理解要比V5.2好很多,而且除了人物主體之外,V6的周邊細(xì)節(jié)也更合理精細(xì)。

    1960s street style photo of a young woman sitting on a sailboat wearing a green silk dress and a pearl necklace. The sun is setting over the ocean, shot on Agfa Vista 200

    「1980年代的懸疑電影,仰拍,身穿黑西裝的法國(guó)管家在維多利亞式豪宅的走廊中手握蠟燭?!?/p>

    從光影和構(gòu)圖來(lái)看,V6更符合要求,主體人物很好地融合進(jìn)了背景里。而V5.2基本都沒(méi)有做到。

    1980s mystery film, low-angle shot of an evil-eyed French Butler sporting a black suit and grasping a candle in the hallway of a creepy Victorian mansion with musty decor. The warm candle glow evokes a spooky sense of mystery

    下面這幅要求畫(huà)出抽象、超現(xiàn)實(shí)的景觀,有融化的時(shí)鐘、扭曲的形狀和浮島,空中有一只眼鏡形狀的巨大月亮。

    其中,V6在空中畫(huà)出了「A large, eye-shaped moon dominates the sky」,而V5.2就沒(méi)有把這部分體現(xiàn)出來(lái)。

    An abstract, surreal landscape with melting clocks, distorted shapes, and floating islands. The color palette is vibrant with a mix of blues, reds, and greens. A large, eye-shaped moon dominates the sky

    這張1970年代的柯達(dá)Ektachrome電影劇照,需要畫(huà)出身穿深V綠色絲綢連體褲的25歲紅發(fā)女子。但V5.2并沒(méi)有把我們要求的深V領(lǐng)口畫(huà)出來(lái)。

    1970s medium-closeup Ektachrome film still of a 25-year-old woman with curly red hair and freckles standing in front of vintage car in downtown Los Angeles. She's wearing a green silk jumpsuit with a plunging neckline. Golden hour

    「五顏六色的珊瑚礁,各種各樣的海洋生物,包括各種魚(yú)、海龜和頑皮的海豚」。

    這次,V5.2直接把海豚無(wú)視掉了,并自作主張地畫(huà)了一個(gè)潛水員……

    A colorful coral reef teeming with marine life. There are various species of fish, a sea turtle, and a playful dolphin. Sunlight filters through the water, creating a dappled effect on the sea floor.「1980年代的間諜電影,年輕的黑發(fā)女人站在埃及裝飾風(fēng)格的豪宅中,有著黑色大理石柱子?!癸@然,V6對(duì)于黑色大理石柱等背景的還原,要比V5.2準(zhǔn)確得多。

    1980s spy movie, Medium closeup shot from low-angle, 35mm film still of a young brunette Egyptian woman standing in an Egyptian Art Deco Mansion with large columns made of black marble, wearing a black sequin dress, inside, daytime, natural lighting「電影劇照,一名偵探在犯罪現(xiàn)場(chǎng)采訪一名女性證人,偵探在做筆錄,目擊者焦急地看著,指著一條線索。」可以看到,V6的人物動(dòng)作更加符合常理,而V5.2的圖片中人物動(dòng)作像是在發(fā)呆,沒(méi)有按照提示詞的描述進(jìn)行做筆錄的行為。

    interviewing a female witness at a crime scene. The detective is taking notes, while the witness looks on anxiously, pointing towards a clue就如同開(kāi)頭所說(shuō),「只要你能說(shuō)得清楚,V6就能給你畫(huà)明白。」如果你是個(gè)想象力大師,可以用邏輯結(jié)構(gòu)清晰、充滿細(xì)節(jié)的語(yǔ)言描繪出心中所想,V6定不會(huì)讓你失望——語(yǔ)言可以控制光影、控制材質(zhì)、控制色彩、控制構(gòu)圖。一句話,語(yǔ)言的魔力已經(jīng)被放至最大:能寫(xiě)出神級(jí)Prompt的人,必得神圖。而相比之下,有ChatGPT加持的DALL-E 3,就不這么苛求用戶的語(yǔ)言表達(dá)能力,而是可以自行想象。難怪大家都說(shuō),Midjourney的上限足夠高,DALL-E 3的下限足夠低。


    文字生成,直追SOTA


    在文字生成上,V6較前代也有了巨大的提升。EMPTY、TOMORROW、Coca Cola,這些字在圖像中想加就加。雖然在準(zhǔn)確度上略遜于DALL·E 3,但視覺(jué)美感方面的表現(xiàn),Midjourney依舊是遙遙領(lǐng)先。不過(guò)需要注意的是,下面這些圖像,每一張都進(jìn)行了3-10次的嘗試,才得了到比較理想的結(jié)果。

    A man standing alone in a dark empty area, staring at a neon sign that says "EMPTY"

    A realistic standup pouch product photo mockup decorated with bananas, raisins and apples with the words "ORGANIC SNACKS" featured prominently

    An anime style movie poster with the stylized words "TOMORROW", with a girl looking upwards at the night sky, and cherry blossoms floating in the wind. --s 200

    A Coca Cola ad, featuring a beverage can design with traditional Hawaiian patterns

    A clean, minimalistic logo featuring an ice cream cone, with palm trees as the backdrop and the words "ICE CREAM OASIS" --style raw

    A clean and minimalistic professionally designed vector of a biker speeding on a highway, with the words "FREEDOM ON WHEELS" --s 250

    A minimalistic product shot of a bottle of perfume on a clean backdrop with the words "Floral Symphony", surrounded by fragrant white flowers

    A modern cinematic movie poster with the words "FALLEN" showing a fallen angel in a dark forest --style raw --s 200

    A modern burger advertisement, with the words "THE BIG ONE", featuring a delicious huge beef burger, with tomatoes and lettuce in the background

    A pixar style illustration of a happy hedgehog, standing beside a wooden signboard saying "SUNFLOWERS", in a meadow surrounded by blooming sunflowers這里,我們匯總了一些可以提高生成準(zhǔn)確率的實(shí)用技巧:

    1. 將單詞大寫(xiě)并放在引號(hào)中,如「LIKE THIS」,可以提高生成的準(zhǔn)確度2. 使用--style raw參數(shù),可以得到更準(zhǔn)確的結(jié)果3. 明確提出是電影海報(bào)(movie poster)和廣告(advertisement),效果更好4. 高stylize值可以創(chuàng)造出更有趣的文字效果

    三大AI生圖巨頭pk,誰(shuí)能勝出?



    所以,現(xiàn)在AI生圖工具的三大巨頭,無(wú)疑就是Midjourney V6、DALL·E 3和Adobe Firefly了。網(wǎng)友們當(dāng)然迫不及待地讓三巨頭展開(kāi)了一場(chǎng)大pk,對(duì)同一主題生圖,一目了然地拼個(gè)高下。Midjourney因?yàn)橛兄浅XS富的光影效果,有極強(qiáng)的真實(shí)感,幾乎沒(méi)有了原先那種「一眼AI」的感覺(jué)。同樣畫(huà)一個(gè)年輕女人,MJ打在臉上的光影效果讓人震撼,人物的眼神在傳達(dá)著某種情緒,整個(gè)畫(huà)面都充滿了電影感和故事感。相比之下,另外兩個(gè)女人美則美矣,眼神卻略顯空洞。

    金發(fā)粉色衣服的美女,MJ畫(huà)的美女骨相耐看,衣服很仙。果然,Midjourney畫(huà)的美女,永遠(yuǎn)是最好看的。

    藍(lán)莓蛋糕,MJ也是贏得很徹底。相比之下,DALL·E 3的AI感還是太重了,一眼假。

    「一對(duì)白發(fā)蒼蒼的老人」這道題,MJ的作品太動(dòng)人了,一張照片仿佛包含了一生的故事。

    機(jī)甲戰(zhàn)士三家都畫(huà)得不多,MJ的背景虛化顯然是做得最好的。

    雪中櫻花的背景,MJ又一次完勝。

    同樣是金發(fā)美女,三張圖構(gòu)圖不同,側(cè)重點(diǎn)也不同。要論故事感,還是MJ完勝。

    拿著相機(jī)的美女,后面是起火的建筑。MJ的人物情緒是對(duì)的,Adobe Firefly畫(huà)的美女笑得就太沒(méi)心沒(méi)肺了,DALL·E 3的人物和背景太剝離,光線太假。

    總之,雖然大家對(duì)于AI生圖的評(píng)價(jià)標(biāo)準(zhǔn)各有不同的,但可以篤定地說(shuō),在藝術(shù)性和創(chuàng)意的觸感上,Midjourney V6這一輪是妥妥地贏了。做對(duì)比圖的博主說(shuō),Midjourney現(xiàn)在是,并且可能永遠(yuǎn)是自己的最愛(ài)。就是因?yàn)樗?,自己才進(jìn)入了這個(gè)AI藝術(shù)社區(qū)。

    這位網(wǎng)友表示,在審美上,MJ把兩位對(duì)手遠(yuǎn)遠(yuǎn)甩在了后面。

    這位網(wǎng)友指出,Adobe Firefly的優(yōu)點(diǎn)就是,讓圖像看起來(lái)如此逼真,以至于你可以直接上傳社交媒體。相比之下,MJ的對(duì)比度更高,更傾向于添加光影。

    很抱歉,請(qǐng)?jiān)谑謾C(jī)微信登錄投票
    你最喜歡誰(shuí)家出的圖? 單選
    Midjourney V6
    Adobe Firely
    DALL·E 3

    參考資料:https://twitter.com/Mr_AllenT/status/1737829217973243990https://twitter.com/chaseleantj/status/1737816505507795060

    本站提醒:投資有風(fēng)險(xiǎn),入市須謹(jǐn)慎,本內(nèi)容不作為投資理財(cái)建議。