智東西(公眾號:zhidxcom)
編輯 | GTIC
智東西4月14日報道,在剛剛落幕的GTIC 2023中國AIGC創新峰會上,計算美學(Nolibox)聯合創始人黃晟昱發表了名為《AIGC驅動設計創意生產機制革新》的主題演講。
黃晟昱向在場嘉賓介紹了設計中的技術演化。他指出,當下AI等新興技術正在經歷爆炸式的發展增長,設計行業正在面臨著飛速增長的設計創意市場需求與高效率及高品質設計之間的矛盾。從行業趨勢上來看,設計創意的過程及方式會隨著機器的進化呈現出多元化的趨勢。總之,AIGC時代,設計行業面臨著生產力變革。
黃晟昱認為,目前實現AIGC驅動下可控的設計創意生產,面臨著“人和機器在設計創意中的語言不可通約性”“復雜設計創意需求的獲取與分析困難”“設計生成創意難以迭代及落地”等三重困境。但這些困難可以通過保證設計資產的可量化性、設計經驗的可歸納性、設計行為的可模擬性等三方面來解決,從而實現從“設計認知”到“機器認知”的轉化。
黃晟昱指出,在AI可直接創作的背景下,人和機器設計角色將發生變化。一方面,將從過去的由人主導、以人機交互方式進行設計變為人機協創。另一方面,設計領域還將出現一種訓練機器的設計師,他們通過訓練機器來實現自己的設計目標。
最后,黃晟昱介紹了設計美學的未來愿景,即通過構建面向未來的智能設計,讓設計工具更包容、設計更簡單、設計創意更普惠。
以下為黃晟昱的演講實錄:
作為最后一個出場的演講者,其實我的壓力蠻大的。大家今天聽了一天的技術干貨,包括前沿的大模型研究、產業應用分享等,接下來,我給大家分享一些好玩的東西。我相信,藝術和設計一直都是大家很關注的內容,這也是我們團隊,包括計算美學這家公司在這幾年一直以來深耕的領域。
我今天演講的主題是《AIGC驅動設計創意生產機制革新》,勢必涉及到設計創意的機制和流程。今天的演講,我將分三個章節跟大家做一個拆解。
第一章節,我想聊一下設計中的技術演化、技術革新及其影響。其中包括技術如何來影響藝術家?如何影響設計師的創作行為?設計工具如何在一次次的技術迭代中不斷演進?
第二章節,基于設計與技術之間的相互糾纏,以及我們在AI設計基礎領域近三年的研究,我想聊一下,如何實現AIGC支持下的設計生成技術的路徑,包括怎么來解構設計量化的數據和語言?如何構建機器可理解的美學評估模型?
最后一個章節,我希望能夠帶著大家了解一下我們發布的幾款產品,我們如何把AIGC轉化為可以落地的設計創意類生產力工具,以及未來是不是每個普通人都將擁有自己的設計創作能力。
一、設計行業面臨生產力變革,創意形式及手段呈現多元化趨勢
首先,我來講一下設計與技術的演進,從時代背景來說,以ChatGPT為代表的新興技術爆發,其實極大地影響了設計行業的競爭和供需關系。
生成式AI使技能變得更加民主和普惠,而技能的民主普惠將會導致設計專業工作模式的變化。從行業趨勢來看,我們會發現,在設計創作領域,無論是工業設計、平面設計、服裝設計,越來越多的設計師開始使用人機協同的技術和方式來推動設計創作手段的多樣性。設計創意的過程也隨著機器的進化呈現出多元化的趨勢。
我們可能會有一個疑問,在AI都能進行自主設計創意的過程當中,人類應該發揮什么樣的作用?如何順應環境的發展合理使用人工智能技術,協同進入到現有的不同垂類的設計行業工作流,從而不讓AI取代人類,而只是輔佐設計師發揮更大的設計創意力量,以及把這種能力賦能給普通人。
回顧一下歷史,其實早在70年前的建筑設計領域,設計學者便思考將能夠運算和思考的機器帶入到設計產品當中。數據和運算在設計領域并不是這幾年才興起的新鮮話題。
每一次運算的進步,其實都伴隨設計范式的引進。比如上世紀60年代提出建筑控制論、宇宙結構學;扎哈·哈迪德(Zaha Hadid)大師提出的參數設計、交互設計;很早之前MIT發布的生成設計;再到目前流行的數字建造、網站的響應自適應布局設計,這些都是技術和設計之間不斷迭代的標志。
2010年以后,設計行業逐漸進入到設計人工智能的時代,尤其是今年,AIGC理念的爆火,將會誕生一些新的生產方式。
除此之外,我還梳理了一下設計與計算的研究發展歷程以及設計與計算的應用發展歷程。在1.0階段,大家很熟悉的Adobe、AUTOCAD等計算機輔助圖形設計工具誕生。這個圖形在上世紀90年代已經在全球范圍之內普及,這些基于機器視覺及圖形學,設計動作會被轉化為量化規則,早年間設計師通過手繪、印刷方式進行創作。
到了2.0時代,比較有代表性的是阿里的魯班設計系統、AutoDraw等輔助智能設計工具,它們基于大量的數據和機器學習來提升設計師的工作效率和能力,自動生成banner、簡單的海報。

在3.0時代,微軟收購OpenAI之后,推出了Microsoft?Designer,我們也推出了圖宇宙和畫宇宙兩款智能產品。這兩款產品以機器為主導進行直接設計創意,并在整個設計流程里輔助設計師,并且賦能給普通人。
二、突破AIGC驅動下設計生產困境,實現“設計認知”到“機器認知”轉化
談起我們做這件事情的初衷,其實在2019年,我們就在清華大學發起了一個跨學科的研究性項目。當時設計學、藝術學、計算機學、數學等不同領域的學者希望在一起做一件激動人心的事,彼時,在這些學者看來,沒有什么比讓機器學會設計創造這件事更讓人激動。
2021年,我們進行了產學研轉化,聯合成立了計算美學,2022年我們分別發布了面向超級創作的生產工具以及智能設計平臺。
縱觀設計學所關注的人工智能研究,我們通過對設計領域的平面、產品、服裝、建筑、室內體驗、UI設計等進行分析,做了一些關鍵詞的聚類分析及檢索。這其中包括中文研究領域相對比較火的專家系統、知識工程、計算機輔助設計、參數化設計等。除此之外,我們還關注國外目前研究的主流方向和趨勢,例如使用大模型或者智能設計產品構建良好的用戶體驗。
那么,具體而言,如果想實現比較可控的、可編輯的智能設計,而不僅僅是用Stable Diffusion生成一張簡單的圖像,那么我們前期需要做哪些準備?
首先第一步,我們需要構建設計認知到機器認知的基礎概念。我簡單做一個類比,智能設計之于設計行業正如自動駕駛之于交通行業,這兩者的結果都很相似。人們提供一個設計需求,完成一個交付,就跟人們打車從初始點到終點,完成旅行一樣自然。
但相比較而言,駕駛行為是一種結構較強的行為,而設計是一種結構性較弱的行為,它具有很強的不確定性。簡單來說,設計一般沒有最優解,如果把設計抽象成一類大家比較熟悉的函數關系,那么函數往往不是唯一。
舉一個非常簡單的例子,當我們打開全球最大的設計素材庫、同時也是一家社交網站的Pintrest去搜熊貓的logo。在不同的語義環境和文化下,人們可能會檢索到不同風格表達的方式,但很難說哪個logo更受人喜歡。可能用戶A喜歡左上角的,用戶B喜歡潮酷一點的,這其實是大千世界影射下設計行為復雜性的典型縮影。
為了實現AI驅動下可控的設計生產,需要解決幾點問題。首先要解決人和設計創作當中語言的不可通約性;第二,要解決復雜設計創意需求的獲取難與分析的問題;第三,要解決設計創意的生成方案難以迭代的問題。我們使用生成式產品做內容創作,當我對整體的畫面很滿意,但是需要對局部細節進行很多微調的時候,目前很多直接生成創意內容的工具沒有辦法去滿足。所以,我們提出通過把握“設計認知”到“機器認知”轉化的三要素來解決這個問題。

首先,是要保證設計的資產具備可量化性,這個可量化性,其實是針對整個設計創意領域中,非線性思維比較活躍的領域數據和數據集的構建。
第二塊是要保證設計經驗的可歸納性,這個設計經驗有點類似于炒菜,當所有的菜品都備齊了,我需要知道菜譜,而這個菜譜正是不同的設計師基于自己的行業知識所產出的先驗經驗和知識。
第三個環節,是要保證設計行為的可模擬性,簡單來說,就是設計師在做設計的過程中,機器怎么基于資產的量化以及經驗的歸納去進行模擬,這個過程我們稱為設計生成的算法可控。
因此,我想把這三個最關鍵的要素跟大家一塊兒分享一下,首先什么是設計資產的可量化性?當大家去一些國內知名的素材網站下載各類平面設計素材的時候,這些確實是設計資產。但是,從機器進行設計創造的角度來說,機器并不理解這些數據結構。
簡單來說,機器只認識這張圖片的尺寸大小,但沒有辦法知道里面的元素所代表的人類主觀情感是什么。除此之外,機器也不知道這張圖片是賽博朋克風、波譜藝術風還是潮流潮酷風?更適合哪些人群?這兩種元素搭配在一起有哪些情感傾向?而這些其實都是設計師基于常年的一些判斷去積累的主觀評價經驗。
所以我們要做的事情,就是把這些停留在數字空間里的死亡狀態下的設計資產,讓機器能夠從主觀的角度去理解它。在這個過程當中,我們構建了全球第一款可商用的視覺設計數據集,我們花了很大工夫自己搭建了標注工廠。
目前,標注工廠以專業的設計師專家系統為主,這其中包括大量普通設計類學生和設計師從業者對于不同元素、視覺內容排版、布局等一系列因素的主觀考量。
我們積累了近20萬套結構化的設計及模型、近3萬張可調用的設計元素、100萬條設計美學的評判標準,在此基礎上,我們搭建了自己的美學推薦及評估系統,這其中包括了以風格標簽、情感標簽在內的超過1000萬次的標簽數據。
跟今天很多嘉賓提到的大模型相比,這個規模可能并不算很大。但是對于設計創意或者平面設計來說,之前沒有人做過這類事情。所以,我們希望通過構建未來面向機器可理解的美學數據集來貢獻我們自己第一步的基礎設施。
其次,我想講一下設計經驗的可歸納性如何實現?在設計領域,有一句大家經常說的話:我在買一個設計師的服務,而不是買設計師給我服務一個月或者一周,我買的是設計師走過的路、旅過的游、讀過的書、看過的電影,以及最終設計方案帶給我的藝術感受。
簡單來說,設計師做設計的過程是一個非線性思維活動的過程,所以我們需要對設計師的設計經驗進行歸納。在這個層面上,我們通過設計信息表達模型來完成不同元素之間設計師的陣列,搭建了面向平面設計的設計師框架,還基于自研的設計語言,為設計問題的重構及設計知識的推廣和遷移等關鍵技術提供了非常有力的理論和技術方案的基礎。
再往下走,在設計行為具體內容上,我們對圖形、文字、色彩、布局、風格等設計構成要素進行了圖譜構建,同時基于已有的數據集,結合已經量化好的設計師的先驗知識,把基礎創意概念和可視化的視覺表達進行了關系映射,為機器提供非常可控、有效接近人類審美的設計作品,提供了一系列的基礎。

最后是如何保證設計行為的可模擬性。因為我們相信,無論Stable Diffusion、ChatGPT給我們帶來怎樣的沖擊和發展,未來主流的設計生產方式一定還是人機協創。
在這個過程當中,我們需要把人類和機器在整個設計鏈路流程當中的分工達到一種最優的配置,其實也就是明確人機協同視覺設計方案過程當中的生成路徑,以及評估和決策路徑。因為人類仍然有決定權去說,這個設計可能適不適合我的輸出和使用。目前,機器通過學習只能是越來越接近決策者對于設計的判斷。
三、針對性搭建底層系統,推動創意生產商業化落地
實現可控的AI設計關鍵技術要點。第一,我們要構建一套統一結構化的設計元語言來打通人和機器之間溝通的不可通約性,讓機器聽得懂設計師的話;第二,進行多通道、多模態創意信息捕捉研究,基于DH需求模型,機器可以通過各種媒介來抓取人們的各種行為,成為它創意的來源;第三,進行多技術耦合設計生成技術研究,設計生成算法方法集、目標導向的約束優化規則集。
最后一步很關鍵,也就是實現人機協同下設計美學評估及決策。這里面涉及到美學評估方法、聯想推薦、包括反向基于人類數據的設計產出的學習。
我們還梳理了一整套流程,即解構設計師不同系列的非線性復雜設計行為,到進行統一結構化的描述,再到設計知識的推理及遷移,以及最終統一化的映射表達、可視化的表達,從而產生方案。
因此,我們也針對性地搭建了三個非常底層的系統,其中包括設計資產量化系統、人工智能AIGC設計生成引擎、云端協同可基于AIGC進行二次創作的專業引擎,這三個底層系統將實現從創意內容生產到具體商業化應用AIGC全鏈路設計服務,有望成為未來產品運作的核心。
四、人和機器設計角色將發生變化,人機協創成為新趨勢
那么就會有人問了,AI可以直接進行創作了,那么設計師還要做什么?人和機器在設計創意角色當中會有怎樣的變化?
在進行AI設計研發的過程中,我們始終關注設計師與機器之間協同分工的比例,并量化了不同的分布,通過不斷的試錯來調整人機協創比例,來提升設計創意的效率以及多樣性。因此我們內部產生了一個新的訓練機器的設計師崗位,這可能是未來構建通用型智能設計模型底層必須要走的路徑。
人類以前通過命令機器去完成一些事情,現在通過訓練機器來達成自己的設計創意目標。以前,我們關注的更多是設計師在軟件使用操作方面怎么樣?現在我們更加關注設計師的原創能力如何?設計師訓練機器進行設計創意的思路如何?這都將成為未來從業者關注的重點。
在AIGC時代,設計創作成本無限趨于零,原有的供需關系已經被打破,原來以為高品質的價格等于良好的設計,但是現在以非常低成本的價格也能產出很fancy的效果。設計技能逐漸從專業化轉向到全民化。門口賣煎餅果子的老太太都可能利用我們的這個產品快速生產新的設計,這是非常有可能的。
大模型產品機會空間廣大,這在今天很多嘉賓的分享中也有體現。但是,大模型目前只拘泥于少數巨頭。對于垂類行業的創意者而言,應該關注專業場景的應用層,因為這其中可能有非常多的潛在機會,未來的巨頭也將會從中出現。
以設計行業為例,從創意內容到設計應用,我們相信AIGC將會驅動整個設計創意自主化加速,從而解放行業生產力。正如設計界非常著名的學者所說的,設計,在人人設計的時代。同時,在這些技術基礎之上搭建什么樣的產品來服務現有的社會、企業及市場的需求,這將關系到全球平面設計市場、全球設計服務市場以及全球創意市場的市值。

我們相信,在未來10年,AIGC至少賦能10億人進行設計創造。按照今年最新的數據,全球的設計從業者為9600萬人,將近1億人,相當于80個人當中就有一個設計師。最新的傳統的設計公司,以Adobe為例,它的市值就比較高,我認為,全球設計市場的工具類市場,肯定有非常大超過3000億美元的巨頭出現。
五、B端、C端雙重布局,構建面向未來的智能設計體
我們希望讓每個人享受好設計,每個人享受好創意,每個人享受好的工具,所以我們在成立兩年多的時間相繼推出兩款產品,也是AIGC超級生產工具。一款是高品質的智能設計引擎,它涵蓋了目前整個非線性設計創意活動的兩個鏈路。
第一個是如何激發設計師的靈感,然后在靈感的基礎上進行繪制以及草圖和素材的積累?第二個是如何成為商業化的設計應用?舉一個簡單的例子,比如今天大會的背景PPT、大會的視覺體系,這些創意內容的組合輸出都需要保證嚴謹性。在商業化的設計應用上,我們推出了圖宇宙和畫宇宙,圖宇宙和畫宇宙將成為面向全球的AI設計創意綜合平臺,同時真正成為一款以機器設計為主導的設計工具,并重新定義什么是未來的設計生產工具。基于此,我們的NoliHub設計量化引擎及設計模型平臺也會向上述兩個產品提供強大的底層模型集數據支持。
再簡單介紹一下圖宇宙和畫宇宙,它們區別于現有娛樂化的AIGC包括AI繪畫產品,我們更側重于把我們的能力,尤其做設計工具操作系統的能力賦能到不同的設計創意垂類行業當中,因此我們在去年早期就定向針對Stable Diffusion模型進行重構,并基于垂類行業的訓練和調整,同時搭配上我們自研的國產AIGC的無線畫板功能,相當于我們提供了非常完善的、針對設計創意的工作流。
在我們看來,單一生成圖像并不能解決整個復雜的設計創意工作,它必須要搭配摳圖替換、圖像超分辨率、文本生成圖像等其他公民進行重新規劃和設計。
我們目前提供B端和C端兩個版本的產品,C端產品為個人用戶提供基于無線畫板以及AIGC功能合成集。目前C端產品已經積累了來自用戶產出的海量AI創意內容,C端產品也因此成為國內最大的AI繪畫社區。
除此之外,在B端產品上,我們是第一家實現對B端需求進行大規模定制的公司。目前,B端產品作為面向專用場景的AIGC專業化的工具,應用于服裝、游戲、工業設計等非常細分且專業的領域。這些也是垂類用戶跟我們共創的產品結果。
在我看來,我們提供多樣化的AIGC模塊更多是為了構建未來面向AIGC模型的專業操作系統,而這個操作系統會隨著有新的垂類行業專業場景玩家的加入而不斷更新,從而使我們的AI繪畫超越簡單的娛樂化功能,而真正成為不同行業領域新的生產方式。
目前,我們通過部署層、模型層、技術層、功能層到整個無線創作畫板空間的產品層構建了第一步創意內容的生產。第二步,我們將基于設計自研的SVG畫板引擎,構建未來的高品質智能設計平臺。這個平臺將包含技術創意內容一鍵設計、海報生成、自適應響應式的開發設計、一鍵多尺寸的視覺海報延展、各類智能化設計的組件等功能,同時還會基于AI營銷文案進行相應填充,包括全局配色,相似風格的生成等。這些都狠狠切在目前傳統設計領域當中的痛點。
我們希望,未來設計行業將告別繁瑣的模板,所有的設計基于自然語言的描述一鍵生成。我們也希望助力更多的企業、商家以及個人,讓他們以非常低成本的價格獲取高品質的設計服務。
我們相信,基于設計認知模型,通過中臺的量化平臺及管理模塊,前臺的三個產品矩陣可以給大家帶來更好的設計體驗。我們希望基于人機協創,構筑面向未來的設計智能體,把非線性的創意思維轉為線性的結構數據,從而形成機器和美學的共同進步,我們也希望構建面向未來的智能設計體,讓設計工具更包容,設計過程更簡單,設計創意更普惠。謝謝各位!
以上是黃晟昱演講內容的完整整理。