智東西(公眾號:zhidxcom)
作者 | 江宇
編輯 | 漠影
智東西9月24日報道,阿里巴巴旗下夸克今日發布全新AI創作平臺“造點”,集成圖像與視頻生成能力,并接入最新版本的通義萬相模型Wan2.5,成為目前國內首個支持“音畫同步”生成的公開平臺。

用戶可通過輸入文本,一鍵生成圖像或視頻。此外,在視頻生成方面,通義萬相Wan2.5支持10秒長度、24幀每秒、1080P分辨率,并可同步生成語音、音效與背景音樂,實現更完整的故事表達。
通義萬相Wan2.5還具備較強的指令響應能力,可在生成過程中呈現運鏡等連續變化效果。
圖像生成方面,“造點”引入了Midjourney V7模型,并結合夸克自研算法進行本地化優化,突出亞洲人像、中文文字及國風視覺表現能力。該平臺支持多圖參考、風格代碼、精細參數調節等功能,還面向電商設計、影游內容創作等專業場景開放使用。
目前,用戶可訪問官網或通過夸克PC端“AI生圖”入口進入“造點”。移動端則支持“一句話P圖”“AI創意視頻”“風格轉化”等功能。截止至9月30日,通義萬相Wan2.5視頻生成功能將面向用戶開放免費體驗。

相比單一模型或單一模態的工具,“造點”在一個平臺內集成圖像與視頻生成能力,嘗試覆蓋更多創作需求。依托通義萬相與Midjourney等主流模型的集成,該平臺在提升生成質量的同時,也降低了內容創作的門檻。
從當前開放功能來看,其在畫質呈現、音畫同步上的表現已有初步完成度,但在長視頻生成、多輪調整等方面仍有待后續觀察。