智東西(公眾號:zhidxcom)
作者 | 三北
編輯 | 漠影
狂飆500多天后,國內的“百模大戰”正進入落地驗證期。當下,行業和產業對大模型的期待,正從“你家大模型有多強?”變為“你的大模型能幫我干什么?”。
10月22日-10月25日,2024中國國際社會公共安全產品博覽會(簡稱:2024安博會)在北京舉辦。作為多年來AI產業發展的一大風向標,這場盛會被產業人士寄托的使命之一正是回答上述問題。而這,也是AIoT頭部企業宇視科技在做的事。
今年安博(bo)會上(shang),宇(yu)視(shi)科技的展(zhan)臺(tai)(tai)成(cheng)為(wei)人氣最高展(zhan)臺(tai)(tai)之一(yi)。通過五大(da)展(zhan)區近百個展(zhan)出單(dan)元,宇(yu)視(shi)亮出了AI大(da)模型(xing)落地(di)的實戰成(cheng)果和作戰圖譜(pu)。
g
▲宇視展臺現場(chang)人頭攢動
像百度搜索一樣檢索視頻內容的“萬物搜”、夜視能力倍增的AI-ISP獵光系列夜視攝像機、能跟用戶互動的AI體育鍛煉屏、助智慧城市治理降本增效的大模型方案……今年宇視已不限于大模型相關部件產品展示,而是實現從軟件、裝備到行業方案全覆蓋。
2023年5月,宇視推出AIoT行業大模型“梧桐”,今年4月升級為“梧桐2.0”版本,多模態及推理能力進一步升級,目前已經衍生和優化了上千種相關AI算法,落地城市、交通、文娛、教育等超十個行業。

▲宇視展(zhan)(zhan)臺現場展(zhan)(zhan)出(chu)的梧桐2.0架(jia)構圖(tu)
當下,AI亟需完成一次新的價值自證和他證。To C消費(fei)類AI大模型產品的流量高峰已被瓜分一波,第二波機會來到了(le)與(yu)實體經濟(ji)息息相關(guan)的To B數字化(hua)轉型市場。
透過宇(yu)視科(ke)技本次(ci)安博會的展(zhan)出,回(hui)溯其在(zai)數字化(hua)(hua)轉型中的“探模”之路,我們可(ke)以看到,大(da)模型的底座(zuo)價值正如何一步步潛(qian)入(ru)千(qian)行百業,轉化(hua)(hua)為(wei)新質生產力。
一、智能升級:基于梧桐2.0的“萬物搜”來了
今年安博會,要說最引(yin)人關注的AI大模型新應用是什么?
可能不是各家都(dou)在(zai)做的智能聊天機器人(ren),也不是爆火的AI視頻生成工具,而是這款名為“萬(wan)物搜”的視頻搜索“神器”。
在(zai)宇視(shi)中心區(qu)域展區(qu),一塊大屏幕前,圍(wei)滿了視(shi)頻數據服務系統“萬物搜(sou)”的體驗者。他們只需要輸入文字(zi)描述,就(jiu)能從現場(chang)實時視(shi)頻內容(rong)中,快(kuai)速(su)檢(jian)索出貼近意圖的結(jie)果。比如(ru)搜(sou)索“拉行(xing)李箱的人”,“萬物搜(sou)”就(jiu)會立刻識(shi)別(bie)并輸出對應(ying)的結(jie)果。

▲“萬物搜”被(bei)許多(duo)觀眾圍觀體(ti)驗
即便(bian)是一(yi)些十分小眾的情況,“萬(wan)(wan)物搜”也可以通過深度解(jie)析和語義(yi)(yi)理解(jie),搜索到用戶所(suo)需內(nei)容。比(bi)如(ru)搜索“帶狗頭(tou)頭(tou)套的人(ren)”這樣語義(yi)(yi)更具(ju)體(ti)的描述,“萬(wan)(wan)物搜”也能準確(que)地識別并找到。

▲“萬物(wu)搜”現(xian)場體(ti)驗
當(dang)輸入“一個舉著手(shou)機拍照的(de)年輕男士(shi)”這種多(duo)個任意元素組合的(de)提示詞,“萬物搜”也能立刻(ke)識別出來貼合表述(shu)的(de)視頻內容。

▲“萬物搜”現(xian)場(chang)體驗
這一應(ying)用(yong)(yong)具有很強的應(ying)用(yong)(yong)價值,比如可用(yong)(yong)于失(shi)物(wu)(wu)招(zhao)領。在一個智慧園區場景,某業(ye)主購買(mai)了(le)一份麥當勞外賣(mai)丟失(shi)了(le),他只需(xu)要借助“萬物(wu)(wu)搜”去搜索“拿(na)麥當勞外賣(mai)的人”,就可以查詢到相關的視頻記錄,從而尋回失(shi)物(wu)(wu)。
宇視相關負責人鄭勇告訴智東西,“萬物搜”基于多模態大模型算法開發。相比于傳統小模型時代的CV識別車牌、衣著等部分有限特征,“萬物搜”的搜索對象的邊界得到了極大擴展,從而使行業價值也得到大幅提升。
究其背后主要的技術難點,還是多模態融合。
據悉,“萬物搜”基于宇(yu)視(shi)自研行業(ye)大(da)(da)模型“梧桐(tong)2.0”,融合自然語言(yan)處理(li)、視(shi)頻特(te)征(zheng)提(ti)取和語音識別多種能力,深度理(li)解分析輸入文(wen)(wen)本(ben)、語音或(huo)圖片,及其上下文(wen)(wen)語境關(guan)系,從而讓用戶可以準(zhun)確(que)搜索(suo)到所需的大(da)(da)部分視(shi)頻內容。
“梧桐(tong)(tong)2.0”是一個(ge)覆蓋(gai)了圖像編解碼、計(ji)算(suan)機視覺、自然語言處理、多模(mo)態等(deng)多個(ge)領域的AIoT行業(ye)大(da)模(mo)型(xing)。根據(ju)宇視官(guan)方數據(ju),其(qi)已(yi)經基(ji)于“梧桐(tong)(tong)2.0”大(da)模(mo)型(xing)面向十個(ge)行業(ye)推出(chu)了近千種長(chang)尾算(suan)法。與此同時,其(qi)在這(zhe)十大(da)行業(ye)“梧桐(tong)(tong)2.0”均已(yi)有產品出(chu)貨(huo)和(he)項目實際落地。
“從業(ye)(ye)者會有一(yi)個很直觀(guan)的(de)(de)感(gan)受,越(yue)來越(yue)多的(de)(de)長尾算法的(de)(de)需求(qiu)都能得到響應,行業(ye)(ye)對(dui)于視頻能力的(de)(de)期待也因大模(mo)型提(ti)高了(le)。”鄭勇說。
可以看到,AI大模型已經催生了一大批智能功(gong)能和行(xing)業算法,呈現出落地(di)可用的效(xiao)果。
而(er)這(zhe),只是AI價值自證的(de)一個開(kai)始。這(zhe)些智能(neng)功能(neng)還需要在(zai)城市管理(li)(li)、交通治(zhi)理(li)(li)、園區運營等(deng)各(ge)行各(ge)業的(de)場(chang)景中廣泛(fan)應用,才能(neng)真正(zheng)發(fa)揮出行業價值。
二、裝備進化:把大模型“塞進”攝像機
在大模型(xing)進(jin)入行業之前,有一個重要(yao)中間環節不容(rong)忽略,那就是“裝備大模型(xing)化”。
當下,我們看到微軟正在將大模型“塞進”電腦,華為、蘋果等手機廠商正將大模型“塞進”手機。而以宇視為代表的AIoT頭(tou)部(bu)企業,也正將(jiang)大模型(xing)“塞進”攝(she)像機(ji)。
大(da)模型(xing)正催生新(xin)的(de)(de)裝(zhuang)備進(jin)化——本次,在宇視展臺上備受(shou)關注的(de)(de)AI-ISP獵光(guang)(guang)系列智能攝(she)(she)像機(ji)就是一大(da)代表。基于(yu)大(da)模型(xing)打造的(de)(de)“獵光(guang)(guang)2.0-AI-ISP”圖像引擎(qing),可以使得前端攝(she)(she)像機(ji)應對多種(zhong)極(ji)黑、無光(guang)(guang)、微光(guang)(guang)場(chang)景(jing)挑戰。
在現場設置的(de)暗室(shi)中,一臺僅(jin)僅(jin)數百元(yuan)的(de)經濟(ji)型攝像機,即(ji)使是在低至令人難以置信的(de)≤0.0001 Lux的(de)照度環境下,依然能夠讓圖像呈現出如同在白晝中一般的(de)鮮艷色彩。

▲AI-ISP獵光系列智能(neng)攝像機效果展(zhan)示(shi)
大模型(xing)+智能攝(she)像機設備,讓過去AIoT行業難以(yi)解(jie)決的痛點迎刃而解(jie)。
眾所周知(zhi),夜(ye)(ye)間是(shi)安(an)全隱患的(de)高發時段。由于光線(xian)不足,人(ren)類視覺(jue)(jue)難(nan)(nan)以清(qing)晰地觀察到(dao)周圍的(de)環境,往(wang)往(wang)使(shi)得安(an)全隱患難(nan)(nan)以察覺(jue)(jue),星光等夜(ye)(ye)視攝(she)像(xiang)機的(de)出現大大緩解了這一問題。但(dan)具有(you)高品質成像(xiang)效果(guo)的(de)傳統夜(ye)(ye)視攝(she)像(xiang)機成本(ben)較(jiao)高,在方案部署的(de)時候容易被(bei)戰略性舍棄。
缺少高性價比的夜視攝像機,這是行業的一大痛點。
宇視(shi)(shi)AI-ISP獵光(guang)系列智(zhi)能攝像(xiang)機(ji)直擊這一(yi)痛點。鄭勇(yong)告訴智(zhi)東西,基于“梧桐2.0”,攝像(xiang)機(ji)算法在訓練的過程中(zhong),可以采用由AI生(sheng)成(cheng)的大量不(bu)同場景的視(shi)(shi)頻(pin)素(su)材,例如微光(guang)的魚(yu)塘、無光(guang)的鄉村小路等(deng),從而大大壓(ya)縮(suo)了訓練成(cheng)本。
同時(shi),基于數千種(zhong)場(chang)景的實驗訓練及(ji)測(ce)試,AI-ISP獵光(guang)系列智能攝像(xiang)機(ji)算法快速(su)迭代,強化拖影收斂、動態降噪、場(chang)景提亮、色(se)彩還原(yuan)、對比度(du)增(zeng)強效(xiao)果,使圖像(xiang)質(zhi)量突破傳統ISP極限。
可以看到,大模型已經展(zhan)現出對裝(zhuang)備“點石成(cheng)金”的效果。
而這(zhe)只(zhi)是“裝備大模型化”眾多例子中的(de)一個。
今(jin)年(nian)4月,宇視(shi)提出“把所(suo)有裝(zhuang)(zhuang)備(bei)(bei)用大(da)模型重做(zuo)一(yi)遍”的理(li)念,隨即推出了(le)一(yi)大(da)批“裝(zhuang)(zhuang)備(bei)(bei)大(da)模型化(hua)”產品,覆蓋了(le)AI端側裝(zhuang)(zhuang)備(bei)(bei)、AI邊(bian)緣端裝(zhuang)(zhuang)備(bei)(bei)、AI邊(bian)緣域裝(zhuang)(zhuang)備(bei)(bei)全業務(wu)場景。
在這三大場(chang)景中,除了AI-ISP獵(lie)光系列(lie)智能(neng)攝像機,大模型(xing)改造的設備(bei)還涉及AI體測(ce)一體機、室內AI體鍛屏、視(shi)頻(pin)智能(neng)推訓一體機、視(shi)頻(pin)數(shu)(shu)據服(fu)務一體機等(deng)多種(zhong)硬(ying)件,都實現了不同(tong)程度的數(shu)(shu)倍效果提升。

▲獵光2.0家族
做“裝備大(da)模型(xing)化”的難點(dian)是什么(me)?
鄭勇告訴智東(dong)西,不(bu)同于(yu)(yu)手機、PC等設備大模型化,AIoT設備在(zai)屬于(yu)(yu)相對弱交互但高專(zhuan)業(ye)度(du)的(de)領域,這就需要在(zai)大模型、AIoT及行業(ye)中都有深耕的(de)業(ye)務團(tuan)隊來進行支持開發,這也(ye)成為宇(yu)視做這件事的(de)一大優勢。
宇視(shi)正(zheng)通(tong)過軟件(jian)硬(ying)件(jian)化(hua)、硬(ying)件(jian)裝備(bei)化(hua)、裝備(bei)序列化(hua)等一系列創(chuang)新研(yan)發(fa),為全行業帶來“裝備(bei)大模型化(hua)”產品(pin)底座(zuo)開放(fang)能力的質變。
當(dang)下,無論是面向消費(fei)者市(shi)場還是企業級市(shi)場,裝(zhuang)備(bei)大模型(xing)化已(yi)經成為(wei)行業發展的必然趨勢。
而從企業級(ji)數(shu)字(zi)化轉型(xing)市場(chang)來看,我國ICT裝(zhuang)備(bei)門類(lei)眾多、產品(pin)強大(da)而豐富。這些裝(zhuang)備(bei)更是(shi)大(da)模(mo)型(xing)落地的重要(yao)載(zai)體,是(shi)大(da)模(mo)型(xing)落地實體物理世界、釋放(fang)千行百業新質生產力的重要(yao)抓手。
三、行業破圈:AI技術的一次自證與他證
大模型(xing)帶來了智能(neng)功(gong)能(neng)和裝備的(de)進化(hua),最終的(de)效果還要在(zai)行業中驗證(zheng)。
作為一家AIoT產品方案及能(neng)力(li)提供商,宇視在視圖(tu)(tu)領域(yu)有著多(duo)年的沉淀積累(lei),致(zhi)力(li)于(yu)在智(zhi)慧城市(shi)、交通、電力(li)、企業園(yuan)區等多(duo)個場景領域(yu)進行(xing)視圖(tu)(tu)價值賦能(neng)。如今這些行(xing)業經驗,也正幫助其大模型加速在行(xing)業落地。
在(zai)本次安博會(hui)上(shang),我們可以看到基(ji)于“梧桐2.0”的(de)智(zhi)能(neng)功能(neng)、裝備已經落(luo)地到了(le)文體娛樂(le)、智(zhi)慧(hui)城市(shi)、智(zhi)慧(hui)交通、生態保護等各個領域。
以宇視在(zai)(zai)現(xian)場展示(shi)的AI體(ti)育方案為例,基(ji)于梧桐大模型的AI體(ti)育鍛煉屏可(ke)以讓很多人站(zhan)在(zai)(zai)同一個屏幕前一起做運動,記(ji)錄(lu)他們的動作(zuo)細(xi)節和成績(ji),為其自動打分(fen)并提供(gong)鍛煉建議。這不僅可(ke)以幫(bang)助校園開展運動、教學,也為社區鍛煉等更(geng)多場景提供(gong)了(le)可(ke)能性。

▲AI體育解決方案(an)展示
鄭(zheng)勇透(tou)露(lu),自梧桐大模型推出(chu)以來,宇視(shi)科技發力(li)文教體領域,推出(chu)了AI體鍛屏、AI跑(pao)步屏、AI足球、旅拍兔VLOG、VR導(dao)游產品等多(duo)個創(chuang)新解決方案,已(yi)快速落地全國百余(yu)個城市。
在剛剛結束的“2024吳鉤(gou)足球(qiu)全國總決賽”中(zhong),直(zhi)播正(zheng)是(shi)由宇(yu)視的AI全景(jing)相機(ji)進(jin)行(xing)智能導(dao)播。在支持多視頻拼接(jie)畫面自動(dong)矯正(zheng)消除(chu)畫面畸變的同(tong)時,其基于AI畫面矯正(zheng)及(ji)運鏡(jing)算法,讓(rang)攝像機(ji)進(jin)行(xing)自動(dong)檢測(ce)控(kong)球(qiu)權、自動(dong)運鏡(jing)跟蹤(zong),從而讓(rang)AI像人一樣去進(jin)行(xing)精彩賽事直(zhi)播。
基于宇視“梧(wu)桐2.0”打(da)造的解決(jue)方案,也同時落(luo)地到(dao)了智(zhi)(zhi)慧(hui)城市治理、智(zhi)(zhi)慧(hui)人(ren)行(xing)、智(zhi)(zhi)慧(hui)車(che)行(xing)、動物(wu)保護等各個領域。
在(zai)某地的(de)(de)智慧城(cheng)市治理中,相關部門應用了基于(yu)“梧桐(tong)2.0”的(de)(de)城(cheng)市解決方案(an),聚(ju)焦(jiao)群眾(zhong)關注的(de)(de)民生(sheng)問題(ti)比如廣場舞(wu)噪音管(guan)理、社(she)區及城(cheng)市的(de)(de)衛生(sheng)管(guan)理等問題(ti),使其得到(dao)高效解決,12345投訴量下降60%。
在這(zhe)類場景中,各種細碎的問題都可(ke)以找到(dao)個性化長尾算(suan)法,比如:噪音傳(chuan)感器加視(shi)頻聯動,解(jie)決工(gong)地超時施工(gong)擾民難(nan)題;物聯網油(you)(you)箱蓋加車載攝像機,解(jie)決危險駕駛隱患和油(you)(you)耗異常等。這(zhe)些行業解(jie)決方案,都不(bu)同(tong)程(cheng)度地助(zhu)力(li)提升管理效率(lv),減(jian)少安(an)全隱患。
大模(mo)型為各(ge)個行業(ye)的(de)數字化(hua)轉(zhuan)型帶來了真(zhen)實價(jia)值,也為各(ge)個行業(ye)的(de)從業(ye)者(zhe)帶來更多機會(hui)和商機。
這不僅是(shi)(shi)宇視AI技術的(de)一次(ci)自(zi)證(zheng),也是(shi)(shi)其與集成商、渠道商伙(huo)伴(ban)開啟的(de)一次(ci)他證(zheng)。
在去(qu)年(nian)6月的北京安博會(hui)現場,宇視啟動(dong)了梧桐大模型種子(zi)合作伙(huo)伴(ban)計劃,與(yu)來自(zi)交(jiao)通、教育、零售、體育公共服務(wu)等(deng)領域(yu)的多位伙(huo)伴(ban)合作開啟共創(chuang)。
宇視提供軟件技術(shu)賦能平(ping)臺,推出了集數(shu)據管理、模型管理、服務(wu)(wu)管理、快(kuai)捷工具(ju)于一體的(de)行(xing)業大模型生態服務(wu)(wu)平(ping)臺;行(xing)業伙伴基于宇視平(ping)臺和協(xie)助,進行(xing)解決方案的(de)開發(fa)和推廣(guang)。
時隔一(yi)年多,鄭勇告訴智東西(xi),一(yi)些(xie)合作比(bi)較深入的伙(huo)伴已經能夠收益。他們通過(guo)宇(yu)視推訓(xun)一(yi)體機去訓(xun)練行業自有模型,將產品和方案銷售給同行或終端用戶,還能進行二次(ci)收益。
可以看到,當(dang)集成(cheng)商、渠(qu)道(dao)商從“搬(ban)箱(xiang)子”的人變為智能化方案咨詢服務商,與(yu)上游設(she)備商的關系由(you)買賣變為培育和共創(chuang)關系,AI技術(shu)的自證(zheng)與(yu)他證(zheng)也(ye)正在接(jie)近完成(cheng)時(shi)。
生(sheng)態(tai)賦(fu)能是一個長期過程。當下,仍然有(you)一些生(sheng)態(tai)伙(huo)伴抱(bao)有(you)慣性思(si)維,希望買回一臺機器就擁有(you)了大模型能力(li),因此在(zai)初始階段(duan)存在(zai)開發上手難(nan)的問題。對此,宇視會(hui)直接跟進和協助(zhu)伙(huo)伴項目(mu)(mu),保障項目(mu)(mu)看(kan)到效果(guo);同時打磨設(she)備,以開發出讓伙(huo)伴更易上手的平臺工具(ju)。
可(ke)以預測,AI大模型帶來(lai)的(de)將是(shi)整個行業(ye)數字化生態(tai)的(de)變革(ge)。AIoT硬件市(shi)場或許會進(jin)一(yi)步向頭部集中,但(dan)算法、軟(ruan)件、解決方案的(de)能力將更多向集成商、渠道(dao)商靠近,從而形成新的(de)行業(ye)秩序。
結語:宇視之路,AIoT行業之變
當全球大模型技術產業(ye)(ye)競(jing)賽加劇,中(zhong)國(guo)企(qi)業(ye)(ye)與大模型技術,正(zheng)(zheng)以更(geng)快的速(su)度和(he)千(qian)行百(bai)業(ye)(ye)搭起(qi)橋(qiao)梁,落地見(jian)效。宇視科技圍繞“裝備大模型化(hua)”的探索之(zhi)路,也正(zheng)(zheng)印證(zheng)了中(zhong)國(guo)AIoT行業(ye)(ye)之(zhi)變。
獨行(xing)快,眾行(xing)遠。裝備(bei)大模型化及產業落地前景遠大,但道阻且長,這是一條必須有(you)伙(huo)伴同行(xing)的(de)路(lu)。我們看(kan)到(dao),產業鏈(lian)上的(de)不少玩家已(yi)經在轉(zhuan)換角色和思(si)路(lu),融(rong)入全新的(de)生態共融(rong)秩序(xu)。AI技術的(de)自(zi)證與(yu)他(ta)(ta)證仍在進行(xing)中,宇視和他(ta)(ta)的(de)伙(huo)伴們將一起合力推動新業態的(de)形成。