智東西(公眾號:zhidxcom)
作者 | ?ZeR0
編輯 | ?漠影
智東西6月12日報道,今日,美圖推出一款能落地的AI視頻產品MOKI,可以輔助創作者打造動畫短片、網文短劇、故事繪本和MV,讓人人都可以用AI輕松創作短片作品。
為了提升可控性,美圖打造了AI短片工作流,只要輸入一小段故事創意,就能用AI快速生成具有完整結構的腳本,然后進行視覺風格、角色形象、角色配音、旁白配音等前期設定的選擇。
下一步,用AI根據前期設定生成分鏡圖,對分鏡圖進行局部修改,將分鏡圖轉成視頻素材,用臺詞驅動角色開口說話。
最后通過智能剪輯、AI配樂、AI音效、自動字幕等功能將所有素材自動串聯成片,一條AI短片作品就完成了。
美圖還與Ainimate Lab共創了一支AI短片。
MOKI將于7月31日上線,訪問www.moki.cn可體驗。
除了MOKI外,美圖還推出專業級AI批量修圖軟件美圖云修V2、用AI制作口播視頻開拍V2、面向電商人的AI設計工具美圖設計室V3、找優質設計服務的視覺創意平臺站酷、游戲物料AI制作與投放平臺奇覓。
6款產品覆蓋商業攝影、口播視頻、電商設計、設計服務、游戲營銷、視頻生成領域,將進一步完善美圖的AI產品生態。
美圖公司創始人、董事長兼首席執行官吳欣鴻宣布,美圖奇想大模型(MiracleVision)已升級到V5版本,美圖將正在通過將AI單點功能串聯成“AI工作流”,進一步助力電商、廣告、游戲、影視、動漫五大行業提高生產力。
隨著大模型能力持續升級,未來美圖將拓展更多視頻創作場景,為創作者提供更加簡單高效的AI短片工作流。
在以AI工作流助力行業和用戶提效的同時,美圖公司全球VIP會員數創下歷史新高,截至6月11日,美圖全球VIP會員數為1063萬。
一、AI視頻產品如何落地?美圖升級大模型架構,6大亮點支撐AI短片創作
今年2月,OpenAI發布AI文生視頻模型Sora,并引發文生視頻領域的激烈競賽。
在Sora發布后,美圖第一時間升級了視頻大模型技術架構,從U-Net架構升級到了更強的DiT架構,同時還升級了編解碼技術,實現了空間域和時間域的同步壓縮。
下面美圖用其自研視頻大模型的部分內測效果快剪的一個治愈向視頻合集。
這只是近期的一個內測效果,下個月美圖將推出效果更好的進階版本。
美圖基于與用戶需求與產品追求自研視頻大模型,升級后的美圖視頻大模型有6大亮點:更強的模型架構、更大的模型參數量、更準的語義理解、更長的視頻時長、更好的動態連續性、更高的畫面穩定性。
美圖公司創始人、董事長兼首席執行官吳欣鴻談道,美圖通過AI短片創作工具MOKI解決了視頻大模型“故事成片難”、“可控性較差”的問題。
在他看來,目前市場上的AI視頻產品傾向于提供像文生視頻這樣的常規能力,但美圖團隊認為只有深度理解創作者的需求、提煉有共性的視頻場景,才能打造輔助內容創作的工具。
以前用視頻大模型輔助內容創作會遇到視覺風格、場景、角色不一致,無法用分鏡進行整體把控,角色無法開口說話等難點。
與常規文生視頻產品不同,MOKI深度理解視頻創作者需求,實現內容和成本的雙重可控,目前可以進行多種視頻場景的AI短片創作。
美圖根據制作成本和內容可控性分析了主流視頻的形式。
空鏡素材對內容可控性的要求最低,生成成本也最低,可靈活應用在各種各樣的視頻里面;專業影視制作,比如用視頻大模型輔助電影電視劇的制作,對于內容可控性有極高的要求,制作成本也是最高的。
所以基于對內容可控性與制作成本的最大考量,MOKI不做常規的文生視頻,而是聚焦于AI短片創作,專注于像動畫短片、網文短劇、故事繪本MV等視頻場景。
借助美圖奇想大模型的底層能力,可構建一個從前期設定到AI內容生成再到后期制作的AI短片工作流。與傳統工作流相比,MOKI大大提升了短片的制作效率,讓視頻創作更加簡單高效。
二、美圖奇想大模型升級到V5:覆蓋圖像、視頻、音頻、文本
吳欣鴻認為,在影像與設計行業,AI是推動創新和提升效率的重要力量。
美圖奇想大模型(MiracleVision)發布于2023年6月,是國內首個懂美學的AI視覺大模型,為美圖全系產品提供AI模型能力。
升級到V5版本的奇想大模型(MiracleVision)采用美圖自研DiT技術架構,涵蓋圖像大模型、視頻大模型、音頻大模型和文本大模型,擁有更好的擴展性與更大的參數量,在語義理解、畫面穩定性、動態連續性、主體一致性、內容可控性以及生成時長等方面,獲得全方位提升。
據介紹,美圖奇想大模型整合了Weitu AI的多模態能力,能理解圖像、視頻、音頻、文本等信息,讓用戶使用自然語言交互實現影像創作。例如使用美圖秀秀里的AI助手RoboNeo,用戶只用簡單的自然語言指令,就能完成一系列復雜的AI改圖、AI消除等圖像編輯功能。
目前,美圖的AI產品生態已經進一步完善:
應用層有AI圖像、AI視頻、AI設計、AI營銷四大模塊的多款產品,生態層由中國領先的視覺創意平臺站酷和美圖AI助手RoboNeo提供服務,模型層由美圖奇想大模型(MiracleVision)為全系產品提供AI模型能力。
“作為一家以美為核心的公司,我們對效果有著極高的要求。只有自研視頻大模型,才能以高標準不斷提升效果。同時,只有將模型與產品深度融合,做到模型即產品,才能給用戶最好的體驗。”吳欣鴻說。
三、多款新品發布:每小時修圖1000張,十分鐘做出高質量口播視頻
結合美圖的應用實踐,吳欣鴻分享了三個觀點:1)目前AI技術領先于AI應用,AI應用比想象中慢不少;2)好概念≠好產品,將AI概念轉化為優秀產品的并不多;3)要讓AI幫用戶創收,用戶愿意為能創造價值的AI產品付費。
對比傳統工作流,AI工作流有五大優勢:1)云端與客戶端實現算力融合;2)一個人就是一支團隊,AI能夠自動化解決很多重復性的勞動,還能讓非專業人士借助AI解決專業領域的問題;3)AI能提供近乎無限的靈感創意庫;4)AI會像搭積木一樣,按需調整,用不同的能力組成工作流,從而完成特定任務;5)AI工作流中模型能夠基于數據自動迭代,速度遠超人工。
除了MOKI外,美圖今日還發布另外5款圍繞影像與設計AI工作流的產品:
1、美圖云修V2:專業級AI批量修圖軟件,年修圖數量已超過5億張,成功幫助商業攝影門店提升了12倍的精修效率。
新版美圖云修升級了AI批量精修和AI批量調色能力,將修圖效率提升到每小時1000張,已開放API服務,實現即傳即修即用,進一步幫助商業攝影客戶大幅提效。
2、開拍V2:用AI制作口播視頻,月活躍用戶數已接近70萬,累計內容創作數超過4000萬,訂閱收入也高速增長,成為一款月毛利突破百萬的AI應用。
新版開拍升級了AI腳本、AI數字人、視頻翻譯、一鍵包裝等能力,10秒鐘就能學會了綜藝感剪輯,不到30分鐘就能創作出一條高質量口播視頻,解決口播視頻創作者的策劃、制作、變現等難題。
3、美圖設計室V3:面向電商人的AI設計工具,擁有近1800萬個月活躍用戶,每月產生超過4000萬的電商物料數。
新版美圖設計室升級了AI批量化能力和AI商品視頻創作能力,并支持團隊多人協作,大幅提升電商物料設計產能。
4、站酷:找優質設計服務的平臺,今年上半年加入美圖大家庭,已有1700萬視覺創意人入駐,擁有4.6億的正版素材,與超過1500家知名品牌達成了深度合作。
站酷推出找人高效、流程簡單、售后放心的設計服務平臺,目前有14類設計服務,連接廣大設計需求者和千萬級專業設計師,以幫助每一位有設計需求的用戶輕松搞定設計,今日正式上線。
5、奇覓:游戲物料AI制作與投放平臺,融合了美圖的AI影像技術與睿晟的游戲營銷經驗,為游戲營銷行業提供廣告的高效制作與精準投放,今日正式上線,并開啟免費試用。
游戲廣告有制作成本高、投放成本高兩大痛點。奇覓AI靈感庫提供了熱點雷達,實時捕捉全網游戲熱點,找到游戲玩家關注度最高的話題,幫助廣告策劃人員去激發創意;AI廣告解析功能可以對熱門廣告的腳本、畫面、配音、配樂進行全方位拆解,快速洞察廣告火爆的原因。
在正式投放前,AI投前分析5分鐘內就能完成數十條廣告的預審核和投放潛力的評估,快速過濾掉高風險的廣告,或者說投放潛力低的廣告。還有批量創建投放計劃,可針對不同的人群去搭建差異化的廣告策略,僅需10分鐘就可以完成3000多條不同廣告計劃的設置。奇覓現已覆蓋巨量引擎、華為、OPPO、vivo等主流廣告平臺,只需1分鐘就能直達這些游戲投放渠道。
結語:未來AI工作流將進化成AI平臺生態
隨著AI大模型的發展,AI應用將經歷從點到線再到面的三階段。美圖打造了眾多爆款的AI單點功能,希望把這些單點功能串成AI工作流,幫助電商、廣告、游戲、影視、動漫等行業進一步提高生產力。
吳欣鴻說,美圖將繼續探索AI應用更深層次的價值,相信在不遠的將來,AI工作流會進化成AI平臺生態,深入影響我們的工作和生活。
美圖在過去兩屆美圖影像節發布的AI產品已得到用戶和市場認可,多次登頂日本、韓國、泰國、越南等國App Store總榜第一。
此外,美圖設計室全年收入過億,Wink是視頻工具賽道第二名,美圖證件照是在線證件照賽道第一名,開拍是口播創作工具賽道第一名。
為持續推動AI應用落地實踐,在第三屆美圖影像節現場,開拍宣布推出“開拍AI助農計劃”,提供三農主題的AI腳本和素材,輔導新農人拍攝和制作視頻,以AI技術助力農村經濟發展。
美圖設計室則推出“小微電商AI助力計劃”,圍繞義烏、廣州、泉州等電商集中城市,助力電商個體創業者“一個人就是一支團隊”,后續還將啟動“電商AI設計課程”,幫助電商用戶提升AI設計技能和訂單轉化。
“美圖是一家成立16年,DNA里刻著對產品的熱愛,并始終保持創業心態的公司。”吳欣鴻談道,面對正在發生的技術與商業變革,美圖將通過實踐不斷探索落地場景,深耕AI應用,為用戶和客戶打造更好的AI工作流,讓每個人都能享受到AI的價值。






























