智東西AI前瞻(公眾號:zhidxcomAI)
作者|江宇
編輯|漠影
智東西9月19日報道,近日,夸克AI生圖已悄悄接入MidJourney V7模型,支持通過中文提示詞調用該模型的圖像生成能力。MidJourney V7是目前行業中表現較為突出的AI生圖模型,其在細節呈現、構圖精度與風格融合方面具備較高完成度,尤其在藝術化視覺表現上更為擅長,此次接入可讓用戶直接體驗V7的圖像生成能力。

智東西獲得本輪內測資格后,第一時間進行了實測體驗。
進入夸克AI生圖界面后,模型默認選中為MidJourney V7。用戶可直接在輸入框內輸入中文提示詞,或使用下方“智能潤色”進行語言優化,也可以點擊“特征詞”快速選擇圖像風格標簽,例如“肖像精細”“復古風”“夢幻效果”“色彩鮮明”等。

夸克AI生圖還支持開啟“加速生成”功能,耗時約15秒,需要消耗16積分;不加速則耗時約30秒,默認消耗8積分。

一次生成圖像數量為4張,畫面比例也可在多種尺寸間切換,包括1:1、16:9、3:2、4:3、9:16等。
此外,在“美學控制”部分還提供三個可調參數,分別為:
1、風格化:控制畫面藝術風格的強弱,數值越高,圖像越藝術化、越遠離提示詞原意;數值越低,則越貼近提示詞。
2、怪異化:用于引入超現實或不規則元素,適合進行實驗性或先鋒風格創作。
3、多樣化:控制4張圖像之間的差異程度,數值越高,四圖構圖與風格差異越大。
以初始提示詞“一位婦女的肖像,她的眼睛反射著星系,頭發像北極光一樣流動,穿著傳統服裝,神秘而智慧”為例,點擊“智能潤色”后,系統會自動生成一版優化后的提示詞——“一位穿著中國傳統長袍的女性,她的深邃眼睛仿佛能映照出遙遠的星系,瞳孔中閃爍著銀河般的光芒,如同夜空中的北極光在她秀發間流轉,飄逸的發絲在微風中輕輕舞動,透露出神秘而智慧的氣質,背景是傳統中國山水畫風格的朦朧山川。”用戶也可以選擇重新潤色,替換為不同版本。

智東西選擇了優化后的提示詞,在默認設置下進行生成:風格化設為100,其余參數為0,圖像比例為1:1。

隨后智東西還嘗試了其余參數組合的生成效果:
1、風格化-0,怪異化-100,多樣化-0;

2、風格化-0,怪異化-0,多樣化-100;

同時,我們也測試了幾組創意類提示詞,覆蓋未來主義、神話風格、寫實幻想等多個方向,進一步觀察V7模型在不同題材下的風格表達能力。
1、故障新藝術賽博美人魚,光纖發絲穆夏發型,裝飾藝術金屬尾鰭,全息孔雀羽毛QR鱗片;

2、新藝術太空艙,穆夏風格外星植物,彩色玻璃舷窗分形星座,裝飾藝術面板發光海藻;

3、故障賽博埃及王,NFT象形文身,碎屏假睫毛,USB頭飾流沙;

4、在月球表面進行的一場足球比賽,穿著宇航服的宇航員在踢球,地球在背景中可見,低重力導致動作夸張;

5、在未來主義背景下的一場時裝秀,模特們穿著融合了歷史風格和科幻元素的服裝,伊麗莎白時代的領子帶有全息投影,維多利亞時代的裙子帶有霓虹裝飾,創意而前衛;

6、一幅靜物畫,展示了一場由珍貴寶石和金屬制成的盛宴,水果像鉆石一樣閃耀,面包有著金色的外殼,一個高腳杯里溢出液態銀,奢華而超現實;

從生成效果來看,MidJourney V7在這些極具創意和風格跨度的提示詞下展現出較強的構圖能力,能實現高完成度的細節呈現與視覺統一性,尤其在材質質感與色彩融合方面表現突出。
除了文本生成圖像功能外,夸克AI生圖也支持上傳參考圖來輔助生成,進一步增強了提示詞控制能力。用戶在上傳參考圖后,可從三種參考方式中進行選擇,分別為“智能參考”“主體參考”和“風格參考”,對應不同的生成策略與圖像融合強度。

智東西在體驗中選擇上傳了馬斯克的一張照片,并輸入提示詞“將男人的帽子移除,替換成一個禮帽”。
在“智能參考”模式下,生成結果能大致保留人物面部特征與背景構圖,但在帽子替換過程中出現了細節失真,模型更注重整體畫面一致性,但人物一致性有一定程度的下降。整體來看,參考圖功能拓展了生圖控制方式,但在人物細節、面部表情的精準還原方面仍存在優化空間。

結語:模型能力強,平臺適配是下一個挑戰
MidJourney V7具備極強的視覺表現力,在構圖、材質、色彩和藝術風格的表達上可支持較復雜場景生成。從體驗來看,通過夸克接入后的生成效果已經具備較高水準,能夠支撐多數創作類或視覺靈感場景需求。
但同時,中文提示詞的適配與調優仍存在一定提升空間,尤其是在精確控制細節、保持人物一致性等方面,仍需進一步打磨。