智東西AI前瞻(公眾號:zhidxcomAI)
編譯 | 江宇
編輯 | 漠影

智東西8月12日報道,由兩名前谷歌員工Coco Mao(聯合創始人兼CEO)和John Qiao(聯合創始人兼CTO)于2022年創立的AI視頻初創公司OpenArt,近期上線“一鍵故事”功能測試版,讓用戶從一句話、一個腳本或一首歌,生成一分鐘故事短片。

Coco Mao曾在Google Search擔任產品經理,并在Google內部孵化器Area 120負責短視頻平臺Tangi的產品工作,早期還參與過Google Photos的機器智能與iOS客戶端研發。

John Qiao曾在Google擔任高級軟件工程師及Area 120技術負責人,創辦過語言學習平臺Tnaao、教育科技公司Zhita,以及AC Fan社區和社交網站Woosuko等項目。

靠搞抽象沖進月活300萬!前谷歌華人團隊玩起“一鍵故事”,卷出vlog神作

▲左1為OpenArt聯合創始人兼CTO?John Qiao,左2為OpenArt聯合創始人兼CEO?Coco Mao(圖源:X)

此次他們聯手創業聚焦AI視頻生成,OpenArt產出的這類被稱為“Brain Rot”的AI視頻,以夸張設定與快速成片能力,受到年輕用戶群體追捧。這類視頻常出現諸如穿著運動鞋的鯊魚、頂著卡布奇諾咖啡杯頭的芭蕾舞者等荒誕角色,目前在互聯網上快速走紅,平臺月活已達約300萬。

靠搞抽象沖進月活300萬!前谷歌華人團隊玩起“一鍵故事”,卷出vlog神作

▲圖源:TikTok

未來,OpenArt還計劃推出支持雙角色對話的視頻生成功能,以及移動端App。

一、從一句話到成片,OpenArt讓“腦洞”落地只需1分鐘

OpenArt聚合50余個AI模型(包括DALLE-3、GPT、Imagen、Flux Kontext、Stable Diffusion),目前新功能支持三類模板:

?角色Vlog:上傳角色圖片+提示詞生成帶情節的視頻;
?音樂視頻:上傳歌曲后解析歌詞并匹配動畫場景;
?解說視頻:可制作解釋性內容或廣告短片。

生成后,用戶可在分鏡模式中逐段調整提示詞以修改細節。該功能支持在同一視頻中保持角色外觀和動作的一致性,從而減少畫面風格不連貫的情況。

二、體驗:vlog驚艷、MV翻車、吉卜力穿幫

1、角色vlog——古風烏薩奇

角色Vlog幾乎是“一鍵故事”的主場。智東西直接選擇自行上傳角色“古風烏薩奇”。

靠搞抽象沖進月活300萬!前谷歌華人團隊玩起“一鍵故事”,卷出vlog神作

輸入官方風格的長提示詞:@古風烏薩奇:在江南小鎮的青石板街上,一位身穿灰色長衫的書生緩緩走向鏡頭,手中搖著折扇,微風吹動他的長發與衣袖。背景是一排白墻黛瓦的民居,河面上緩緩駛過一艘小舟。書生停在橋頭,對著鏡頭微笑并朗誦一句詩,隨后轉身走向茶館。

風格:古風寫意,溫潤淡雅

鏡頭:遠景跟拍→中景人物特寫→平移展示橋與河面→切回書生正面特寫

光效:柔和的晨光,帶有輕霧效果

動作:緩步行走、搖扇、抬頭微笑、輕聲吟詩

特效:微風拂動長衫、河面波光粼粼、茶館燈籠微微晃動

畫幅比例:16:9

時長:60秒

體驗成果:

成片幾乎一比一還原了提示詞——鏡頭順序、角色動作、光效細節都對位,角色一致性也保持得很穩。生成后還能在故事板里改腳本,或者用時間線直接做二次剪輯,這個模式下可玩空間最大。

靠搞抽象沖進月活300萬!前谷歌華人團隊玩起“一鍵故事”,卷出vlog神作

▲故事版

靠搞抽象沖進月活300萬!前谷歌華人團隊玩起“一鍵故事”,卷出vlog神作

▲時間線

2、MV——《落葉歸根》

智東西接著試了音樂視頻,選的是《落葉歸根》前奏片段。

靠搞抽象沖進月活300萬!前谷歌華人團隊玩起“一鍵故事”,卷出vlog神作

流程是先上傳歌曲,再選擇平臺角色或自定義形象。此次體驗中,智東西選用了一張AI生成的男歌手形象作為主角。

靠搞抽象沖進月活300萬!前谷歌華人團隊玩起“一鍵故事”,卷出vlog神作

▲此圖為AI生成。

靠搞抽象沖進月活300萬!前谷歌華人團隊玩起“一鍵故事”,卷出vlog神作

體驗成果:


 生成視頻在畫面切換節奏上基本跟著音樂走,但唇形與歌詞嚴重不同步,人物形象與最初設定也有明顯落差。在前奏部分,觀感也有些割裂。

3、解釋視頻——AI Agent

最后,智東西試了試解說視頻。主題選“AI Agent”,AI自動生成了腳本,再套用吉卜力風格。

靠搞抽象沖進月活300萬!前谷歌華人團隊玩起“一鍵故事”,卷出vlog神作

體驗成果:

畫面色彩和場景細節都不錯,可一到人物轉身,就出現了生成視頻的老毛病——鏡頭直接把角色的臉替換成了后腦勺,沒有轉身動畫,違和感撲面而來。

這三輪體驗下來,古風Vlog的還原度和角色穩定性讓人印象深刻;音樂視頻在人物統一性和唇形同步上有明顯短板;解說視頻的美術表現亮眼,但動作銜接仍不夠流暢。

“一鍵故事”已經能讓創作者從零到成片的時間壓到幾分鐘,但要做到全流程免修,還得等它補齊動作、同步、細節這些短板。

三、一邊漲粉一邊踩“紅線”,OpenArt也面臨版權風險

OpenArt采用積分訂閱制:基礎版14美元/月(約合人民幣100元/月,4,000積分,可生成4個“一鍵故事”、40個視頻、4,000張圖片、4個角色);進階版30美元/月(約合人民幣215元/月,12,000積分,12個“一鍵故事”);無限版56美元/月(約合人民幣402元/月,24,000積分);團隊版35美元/月/人(約合人民幣251元/月/人)。

目前,OpenArt已獲Basis Set Ventures和DCM Ventures共500萬美元投資(約合人民幣3590萬元),目前現金流為正,預計年化經常性收入超2,000萬美元(約合人民幣1.4億元)。

但AI視頻在版權與濫用風險上仍有隱憂。測試發現部分模板可能涉及皮卡丘、海綿寶寶、馬里奧等知名IP。今年6月,迪士尼和環球已起訴Midjourney侵犯版權。

OpenArt聯合創始人兼CEO CoCo Mao稱平臺會默認拒絕生成受保護IP角色,并有意與權利方洽談授權,但不排除偶有“漏網”,用戶若被判侵權,可能面臨下架或法律訴訟。

結語:視頻生成沖進“分鐘時代”,成片質量還未到天花板

從古風Vlog的高還原度,到音樂視頻的唇形錯位,再到解說視頻的動作穿幫,OpenArt的“一鍵故事”展示了當前分鐘級視頻生成的真實狀態:在角色一致性、鏡頭調度和風格化表現上已有不錯的還原度,但在音畫同步、復雜動作和細節連續性上仍有短板。

平臺一次生成會在數十個可選模型中擇一調用,最終成片的質量不僅取決于模型本身的能力,也取決于用戶的提示詞編排和平臺對生成結果的控制。

對于視頻生成來說,如何在保持生成速度的同時,讓細節和質感穩定可控,將是下一步的關鍵挑戰。

來源:The TechCrunch、領英