智東西(公眾號:zhidxcom)
作者?|?程茜
編輯?| 心緣
智東西10月24日報道,今天,2024科大訊飛全球1024開發者節上,科大訊飛星火大模型再次重磅升級,星火4.0 Turbo多項能力全面超過GPT-4 Turbo。
訊飛星火大模型4.0 Turbo在文本生成、語言理解、知識問答、邏輯推理、數學能力、代碼能力、多模態能力七大能力中全面超過GPT-4 Turbo,數學能力、代碼能力超過GPT-4o,星火4.0 Turbo效率相對提升50%。

此外科大訊飛還首發了星火超擬人數字人、星火多語言大模型、汽車端側星火大模型。面向醫療、教育、工業等場景,科大訊飛首發基于“問題鏈”的高中數學智能教師助手,以及實現了訊飛星火醫療大模型2.0的六大核心場景能力升級,同時發布訊飛星火醫學影像大模型。
基礎設施層面,科大訊飛董事長劉慶峰宣布科大訊飛、華為、合肥市大數據資產運營有限公司三方聯合打造的國產超大規模智算平臺“飛星二號”正式啟動。
劉慶峰公布了科大訊飛亮相星火大模型一年來的應用落地成績單:訊飛星火央國企中標第一、教育醫療市場第一、智能汽車市場第一、智能硬件市場第一、工業大模型第一、賦能科研應用第一、大模型開發者生態第一。
具體的一些數據指標為,2024年1-9月,訊飛星火智能硬件GMV同比提升50%,截至10月23日,雙十一大促全渠道GMV同比增長280%;訊飛星火App安卓平臺累計下載量2億。
一開場,劉慶峰就展示了幾個科大訊飛應用落地的典型案例。
科大訊飛和華為聯合研發了小藝聲音修復,能讓特殊人群的發音更加清晰,實現正常交流。

硬件方面,科大訊飛基于翻譯技術打造的多語種AI翻譯透明屏,能幫助用戶通過這塊透明顯示屏實現無障礙交流。

從檢測空調到檢測智能汽車,科大訊飛的VIAS智能座艙人機交互效果評測機器人,目前在測試場景能覆蓋車控、導航等1383個功能點,達到了人工檢測的90%以上,測試提效10倍。
一、七大能力超GPT-4 Turbo,首發超擬人數字人
訊飛星火4.0 Turbo實現了七大能力全面超過GPT-4 Turbo,其中數學能力、代碼能力超過GPT-4o,星火4.0 Turbo效率相對提升50%。同時,在國內外中英文14項主流測試集中,星火4.0 Turbo拿下9項第一。

在數學能力中,星火4.0 Turbo的標準考試任務能力、實用數學任務均超過GPT-4o。劉慶峰介紹,該模型已經完成超長思維鏈、樹搜索和自我反思評價等算法驗證,預計今年底可以實現類o1的高難度數學能力顯著提升。

代碼能力層面,在HumanEval測試集上,星火4.0 Turbo性能已超越GPT-4o,并且針對個人開發者,科大訊飛還推出7B版本,支持大模型在本地運行。

科大訊飛將萬物互聯時代的多模AIUI交互標準進一步擴展,從此前的遠場高噪、全雙工、多語種多方言、多模態,延伸到了超擬人、個性化。
基于星火大模型,科大訊飛的語音交互拓展到了音視頻流的實時多模交互。
首次發布的星火超擬人數字人,可以實現口唇、表情、動作的語義貫穿,用大模型自動生成,并保持語義一致性。
科大訊飛副總裁、研究院院長劉聰現場進行了真機演示,超擬人數字人可以展現出目瞪口呆、賣萌的表情,實時與用戶實現交流。
并且,超擬人數字人還擁有實時視頻流的動態交互能力。用戶只要打開攝像頭,將其對準想要詢問的畫面就能對動態畫面進行實時交互提問。
劉聰演示過程中,在桌子上擺了孫悟空、奧特曼、怪獸的玩偶,超擬人數字人直接根據玩偶的站位變化,講述了一個生動的故事。
旅游場景中,超擬人數字人還能幫你快速了解挑選的化妝品、禮品的信息,同時也能快速識別花草,以及種植花草的注意點。
用戶還能一張照片生成自己的虛擬人,一句話創建發音。在虛擬人的編輯頁面,用戶可以自主選擇聲音或者讀一句話創建自己的擬人發音,也可以調整自己的人像照片、性格等。
下面就是演示過程中,劉聰創建的數字人。
超擬人數字人的聲音自然度達到4.2分,劉慶峰稱,最好的播音員可以達到5.0分左右,真人水平一般為4.0分左右。
此外,在遠場高噪場景,今年9月,科大訊飛在語音識別領域的賽事CHiME-8奪冠,并拿下連續五連冠。當下,科大訊飛的語音識別也首次實現全國地級市方言全覆蓋,包括288個地市202種方言。
二、首發八個語種多語言大模型,1.3B汽車端側大模型
基于全新發布的星火4.0 Turbo,科大訊飛首發了星火多語言大模型、汽車端側星火大模型。
星火多語言大模型首批可以支持中文、英語之外的八個語種,其能力整體達到GPT-4o 96%的水平,多行業任務場景效果超過GPT-4o。

與此同時,多語言的交互也為汽車的智能交互提供了工具。
基于大模型能力,用戶與汽車的交互已經從導航、命令控制等基礎應用交互,提升到包括用車助手、旅行家等應用層面,使得活躍用戶的日均交互從7次提升到了18次。
為了讓大模型直接在汽車部署,科大訊飛發布了參數規模為1.3B的汽車端側星火大模型,相比于參數規模更大的模型,其效果損失≤1%,端側首響40ms,端云融合交互低至1.3s。

2024年第四季度,該模型將會在奇瑞、廣汽、長城將有多款車型陸續上市開售。
在交互之外,科大訊飛正在與開發伙伴一起為車企構建豐富智能體生態,包括汽車內的支付、影視等。
三、深入教育、醫療、法律場景,用AI過濾作業、診斷醫療影像
訊飛星火大模型的軟硬件已經在教育、醫療等場景實現了深入應用。
1、教育:高中數學教師助手,用AI過濾作業必答題、選做題
在教育領域,科大訊飛首發了基于“問題鏈”的高中數學智能教師助手,并邀請12個區域的50多位數學教研員、400多位教師人員共創。這一教師助手可以幫助老師定位孩子薄弱環節,進行啟發式講解。明天,科大訊飛還將發布帶有智能教師助手的星火智慧黑板2.0。
面向家庭學習,科大訊飛發布了搭載到學習機上的AI作業過濾器,能夠幫助學生對作業、考題篩選,基于其對學生的知識習得能力等進行判斷,選出學生的分為必答題、選做題和可不做題。這一功能預計在11月中旬上線。

2、醫療:醫療大模型六大核心場景升級,發布醫學影像大模型
訊飛星火醫療大模型此前發布的功能包括智醫助理、智慧醫院、訊飛曉醫等。
其中智醫助理已經在611個區縣,完成了8.6億輔助診斷次數,8100萬不合理處方提示;智慧醫院完成了5000萬次AI患者服務,完成6億次疾病隨訪;訊飛曉醫的下載量達到1500萬次,完成了1.1億次AI咨詢。
在此基礎上,訊飛星火醫療大模型2.0實現了六大核心場景能力升級,包括醫療海量知識問答、醫療復雜語言理解、醫療診斷治療推薦、醫療專業文書生成、醫療多輪交互、醫療多模態交互。
在細分的醫學影像方面,目前圍繞醫學影像的診斷治療,存在影像科醫生數量相對不足、拍片質量參差不齊、重復影像檢查發生率達到41.82%的問題。

在此背景下,安徽省實現了全國應用規模最大的影像云平臺,實現了一次檢查全省互通互認。
科大訊飛發布訊飛星火醫學影像大模型,能完成智能智控、智能診斷、智能讀片。影像助手可以幫助醫師進行解釋溯源,找到對應的判斷標準,還能對比患者之前的影像CT。
3、法律、企業、科研:用戶工作效率翻倍提升,政務場景審核時間縮短80%
星火大模型賦能法律和政務,法律大模型的場景應用包括AI書記員、AI文書助理、AI法律檢索助手;政務場景的星火智辦一體機,使得用戶遞交材料的審核時間縮短80%,登記效率提升5倍,
面向企業,科大訊飛為企業大模型構建提供頂層規劃到執行落地的全套解決方案,包括數據工具請洗臉、SFT數據工具鏈、場景優化工具鏈、多模態知識零采編系統,提升“理數據、訓模型”的效率。
在科研方面,星火科研助手2.0已經中國科學院下屬116個院所使用,同時,科大訊飛已經聯合團隊開展了AI+生物科技、AI+科學裝置的科研攻關。
結語:大模型生態繁榮,AI正改變科研范式
訊飛星火大模型從發布至今,都在強調基座模型升級與行業應用的緊密結合,目前其已經發布20多個行業大模型,打造了300多個智能體應用,這些形成了可以相互借鑒和復用的規模化效應。
如今,以大模型為代表的通用人工智能發展迅猛,今年諾貝爾獎、物理學獎、化學獎都與AI強相關,AI改變科研范式已經成為科技界的共識。以科大訊飛為代表的國內大模型廠商,正在其中扮演著愈加重要的角色。