芯東西(公眾號:aichip001)
作者 | ?ZeR0
編輯 | ?漠影
芯東西7月30日報道,今日下午,上海通用智能CPU創企此芯科技發布AI PC戰略及其首款芯片“此芯P1”,并全面開啟AI PC產業鏈戰略合作。
這意味著AI PC芯片市場迎來又一重要玩家!
歷經15個月研發、4個月生產、3個月測試,此芯科技推出專為AI PC打造的高能效AI CPU芯片——此芯P1。
該芯片采用6nm制程工藝、12核Arm架構CPU(包含AI指令加速)、10核桌面級GPU設計,內置多媒體引擎、高性能的訪存子系統和豐富的AI異構計算資源。
其端側AI異構算力達45TOPS,滿足Windows AI PC提出的40TOPS算力要求,可運行100億參數以內的端側大模型,跑大語言模型吞吐量可達30tokens/s以上。
“此芯P1”一次性流片成功,經嚴格測試,完全達到量產要求,將正式進入產品化階段。
三年磨一劍。此芯科技創立于2021年10月,“此芯P1”于今年4月成功點亮,距今剛過100天。
此芯科技創始人兼CEO孫文劍特別感謝了聯想集團、蔚來汽車、Arm、安謀科技、Cadence等對此芯芯片的定義、研發、方案提供的大力支持,并對眾多投資方的理解與信任予以感謝。
▲企業信息查詢平臺企查查顯示的此芯科技融資歷程,最新一輪融資是今年4月的數億元A+輪融資
一、基于“一芯多用”發展戰略,打造新一代AI PC算力底座
“三年前的一個夏天,我和我的伙伴們勇敢踏上這條充滿不確定性因素和挑戰的道路,創立了此芯。”孫文劍回憶道。
三年前,當看到AI技術蓬勃發展,他萌生了成立一家AI CPU芯片企業的念頭。那時生成式AI還沒興起,無論是國際大廠還是國內創企都將注意力放在數據中心服務器芯片、云端AI訓練或推理芯片上,真正在做AI CPU的企業寥寥無幾。在孫文劍看來,時至今日,在國內這條賽道上,此芯科技依然是孤獨的前行者。
在產品開發及與客戶深入合作的過程中,此芯科技快速形成了“一芯多用”的發展戰略,此芯定義的AI CPU可用于AI PC、服務器、智能座艙和元宇宙,一方面因為其定義的產品能滿足這些場景的需求,另一方面多場景落地能增加銷量,攤薄前期研發成本,帶給客戶更高性價比的產品。
在研發方面,此芯將堅定做多元異構,讓CPU、GPU、NPU在一顆復雜的SoC上發揮優勢。同時,此芯既擁抱全球生態,又與本土生態緊密結合,為不同用戶群體打造有競爭力的產品。
孫文劍坦言,一款有競爭力的CPU,面對的生態地位非常高,需要的人才密度特別大,所需要的資金體量也很大,產品的導入周期很長,難點多到能列出一大長串。
此芯科技深知路要一步一步的走,首先會聚焦于AI PC產業變革,與合作伙伴一起打造出有競爭力的產品,同時有序開展其他平臺和解決方案的建設,最終實現個人計算、車計算、元宇宙計算和工業計算四大平臺范圍的多元發展。
孫文劍認為,PC是人類過去40年最重要的發明之一,PC產業發展可分為圖形界面革命、互聯網革命、生成式AI革命三個階段。端側生成式AI正在推動PC產業的第三次革命。
在三年前做產品定義時,此芯科技就將PC作為主場景,充分利用AI技術來打造新一代算力解決方案,并在思路上逐步形成了新一代AI PC算力底座的五大特點——異構算力,高能效,面向生成式AI構建豐富的軟硬件開放生態,混合AI,提供系統級安全和隱私保障。
據孫文劍分享,此芯科技有一支非常優秀的SoC團隊,不但完成了前端的架構和設計驗證,而且獨立打造了此芯自己的后端處理流程,高質量完成了芯片后端的設計,確保芯片的性能、功耗、面積在先進制程下達到最優。
此芯科技的首款芯片“此芯P1”,便是在此基礎上設計而成。
二、首款AI CPU詳解:12核CPU、10核GPU,能跑百億參數大模型
作為一款專為AI PC打造的高能效CPU,此芯P1采用6nm制程、Arm架構多核CPU、全新架構的高性能桌面級GPU,還有強大的多媒體引擎、豐富的AI異構計算資源和高性能的訪存子系統。
該芯片的具體特性如下:
1、CPU:12核Arm CPU(8個性能核+4個能效核大小核設計),主頻最高可達3.2GHz,針對PC場景優化的多級緩存設計,還有高效的機器學習指令增強,集成2個SVE2向量加速單元,并有硬件級安全特性保障。
站在用戶角度考慮,CPU核心有兩點很重要:高能效,生態豐富。這也是為什么此芯科技選擇采用Arm架構。孫文劍認為Arm架構有機會在AI計算時代成為端邊云一體的統一算力架構。
2、GPU:旗艦系列10核桌面級GPU,滿足極致桌面渲染與通用AI計算需求;新一代硬件光線追蹤,能實現媲美主機級別的游戲體驗;采用新型幾何圖形處理流程,功耗節省可達40%以上;靈活的可變速率渲染(VRS),性能提升可達50%以上;面向多場景的此芯GO圖形引擎,滿足行業應用需求。據孫文劍透露,此芯團隊正與產業伙伴合作,實現超出大家預期的GPU性能水準。
3、異構AI引擎:端側AI異構算力達45TOPS,可運行100億參數以內的端側大模型,運行大語言模型吞吐量可達30tokens/s以上,支持Stable Diffusion文生圖。
其AI處理能力由CPU內置的SVE2向量加速擴展、GPU支持OpenCL/Vulkan加速、30TOPS算力NPU、對音頻視頻處理更高速高效的專用DSP、NeuralOne AI軟件棧高效的異構調度等共同實現。
此芯P1已完成對多種開源大模型的適配優化,比如Llama、通義千問等端側大模型。SVE2在預填充(Prefill)階段帶來32%~2.2倍的性能提升,在解碼(Decode)階段可帶來27%~42%的性能提升。后續此芯科技將繼續引入Arm AI加速,結合GPU和NPU的異構算力,進一步加強端側大模型的支持。
4、多媒體引擎:具備4K120幀顯示,最多支持10路外接顯示;支持8K60幀視頻解碼、8K30幀視頻編碼;支持PC級別的高保真應急處理,內置專用DSP;支持4K30幀ISP和多攝像頭輸入。
5、高性能的訪存子系統:128-bit LPDDR5低功耗內存,數據傳輸率可達6400Mbps,帶寬可達100GB/s,容量可達64GB。
6、高效的功耗管理:精準的動態調頻調壓,多電源域和動態的電源門控,支持標準的PC電源工作模式,通過綜合設計來實現功耗和性能的調配和平衡。
7、全方位的安全引擎:生態完善的CPU安全特性,滿足認證需求的高密和國密算法,靈活的TPM/TCM安全方案,從底層保證數據安全。
8、多樣化的外設接口:支持PCIe 4.0、AI加速卡、4x USB-C、2x GMAC等,通過不同配置靈活擴展了AI運算、圖形圖像渲染、不同類型外部存儲控制等功能,結合NPU可提供5路高清流暢視頻剪輯對比。
9、多操作系統支持:是全球為數不多采用統一固件支持多桌面操作系統產品,其軟件團隊對內核及框架層做了全棧優化。
“在第一代產品中,我們的團隊就前瞻性地采用了許多業界一流的技術,讓此芯P1成為一個有競爭力的產品。”孫文劍說。
三、融合兩大架構優勢,融入PC產業朋友圈
此芯科技不止是交付芯片,還有完善、成熟的解決方案。
除了有競爭力的硬件平臺、標準的軟件SDK、標準的BIOS外,此芯科技還與操作系統和大模型進行了開發、適配與優化,秉承開放心態與產業伙伴一起打造越來越有競爭力的AI PC產品。
據此芯科技聯合創始人、系統工程副總裁褚染洲分享,此芯AI PC平臺有三個策略:融合x86和Arm架構優勢,融入PC產業朋友圈,融通AI的世界。
褚染洲說,此芯科技集合了眾多新興產業的研發老兵和移動設備領域的佼佼者,從一開始甩開各種包袱,融合吸納各家之所長,更好地實現此芯Arm架構CPU芯片在PC領域的普及和融入。
基于“三融策略”,此芯推出了新一代高能效AI PC平臺解決方案。
其一大特點是可擴展異構計算,可通過PCIe接口擴展的獨立GPU和獨立NPU來進一步提升異構算力。另外,此芯平臺標配高帶寬存儲,大容量空間作為主內存池,同時還支持高速USB接口,可擴展外部存儲,提供大容量的存儲平臺。
此芯的一款芯片就能支持筆記本、迷你電腦、一體機、臺式機、家庭娛樂主機、企業邊緣側主機等多種產品形態。
為了支持多種產品形態,此芯創新性地推出了彈性化電源設計方案:左邊VR+DrMOS常見于高性能、主流x86 PC設計中,右邊PMIC是極致輕薄本、二合一等移動設備的主要電源供電方式,中間便是此芯獨創的混合VR+DrMOS、PMIC模式,能提供更大的彈性,以應對復雜供電能力、功耗、性能、散熱和空間要求之間的平衡。
褚染洲說,三種組合設計都已經在平臺上面充分驗證過了,這離不開此芯自主研發的集成在此芯P1的系統管理單元和優秀的電源管理架構。電源在高性能芯片和終端產品里是最具挑戰的技術之一,也是此芯在融合路上堅定的第一步。
此芯科技積極融入PC產業鏈,能夠支持新興廠商從x86 CPU無縫切換到此芯P1。如果采用此芯P1的合作模式,能以較低成本快速完成一個產品的研發生產和上市周期。
此芯已引入ODM、IBV、IHV等產業伙伴,推動Arm端側UEFI+ACPI標準(Arm SystemReady認證、多桌面操作系統支持),兼容PC全供應鏈,并能做到8~12次通孔、高密度板等PC類產品常用全類型PCB的使用。
褚染洲承諾,此芯科技會提供全面的設計文檔、完整的開發工具、研究的參考設計、可靠的固件和驅動、快速高效的客戶響應,歡迎大家接洽。
四、自研全棧軟件方案,加速AI PC行業創新
此芯科技聯合創始人、軟件工程副總裁劉剛談道,在芯片公司里,軟件工程師的首要工作是發揮硬件的全部能力,不同用戶場景往往意味著不同的軟件解決方案,此芯科技的AI PC軟件解決方案首先面對的就是生態話題。
據他分享,這些年Arm逐漸發展向高性能領域,結合高能效優勢,在PC領域占據一席之地,此外Arm提前多年在異構計算方面進行了技術和生態積累,而且是一個從硬件到軟件都開放合作的生態,有利于集眾人之力進行突破和創新。
此芯科技希望建設一個關于PC的新生態,這個生態既不像x86那樣封閉固化,又不像其他新興生態那樣被動,既有x86生態帶來的高性能體驗,又有開放協作的特點。在劉剛看來,Arm正是新生態的最佳選擇。
除了機遇外,還有一些PC固有挑戰,比如啟動固件、統一內核等方案需要全行業一起推進,新型的端側AI方向更需要大家緊密協作。
作為AI PC芯片領域新勢力,此芯科技重點聚焦這四大方向進行軟件優化:用UEFI統一固件解決多桌面操作系統的支持問題,用統一內核支持DT/ACPI、拉通移動端和PC端,用此芯前沿的解決方案(此芯GO圖形引擎、此芯NeuralOne AI軟件棧)和Arm及眾多生態合作伙伴一起擁抱標準化的機制,加速AI PC行業創新。
如圖,移動端與PC端的啟動固件不同,安卓和嵌入式世界的標準接口是Device Tree,PC世界用的是ACPI接口。兩套做法對應兩個生態的不同規則,移動端更強調垂直整合,PC端更強調通用性。芯片原廠也需要更多啟動固件來支撐。
通過此芯各團隊的創新,此芯實現了通過一套固件支持多桌面操作系統啟動和一套內核同時支持ACPI和Device Tree兩個規范的重要突破。
此芯科技現場演示了由此芯P1驅動的電腦從BIOS到操作系統的完整啟動過程,BIOS會對系統進行初始化和質檢的動作,然后切換到操作系統的啟動過程中,會出現多個操作系統的選擇畫面。從演示來看,此芯P1運行流暢,能跑網頁瀏覽、本地和在線視頻播放、辦公套件等不同PC應用。
這意味著其可以通過一個固件支持不同的國產和國際操作系統。劉剛強調說,做到這一點意義重大,一方面兼顧多個生態,為此芯進行了研發的最大化資源復用,另一方面幫助解決了行業痛點,極大降低合作伙伴進行產品化的難度。此芯也會與上下游一起用UEFI+ACPI的解決方案,推進AI PC系統底座的標準化建設。
在GPU圖形領域,好的GPU往往伴隨著好的視覺體驗,但GPU的開發和調試充滿挑戰,比如兼容各類桌面環境、適應傳統應用、支持OpenGL標準、不同多媒體框架協同等問題。
“在業內,有能力、有勇氣、有動力去解決這些難題的公司屈指可數。”劉剛談道,此芯在合作伙伴的支持下,自己設計的此芯GO圖形引擎引入了中間的應用兼容層,并在核心驅動層實現了原創優化,目標是一站式解決行業痛點,實現桌面級GPU極致體驗。
此芯同樣通過PPT演示了效果,左邊代表生產力相關的工程建模渲染軟件,中間是桌面PC上的傳統3A游戲大作,右邊兩個是GPU桌面級基準測試,此芯P1都能流暢運行。
隨后,此芯還演示了此芯P1能夠在三路并發的情況下很好支撐高畫質游戲。
針對AI應用,此芯推出了面向不同硬件單元的NeuralOne AI軟件棧,來幫助開發者隱藏所有的硬件信息,降低開發難度,并對不同類型的主流模型和推理框架提供廣泛支持。
現場演示了在此芯AI助手上,用NeuralOne AI軟件棧適配阿里通義千問近百億參數的大語言模型的效果,從左到右分別涉及數學物理題、高考作文題、中國人文經典迷惑性問題,此芯AI助手都可以用中文游刃有余地與用戶交流。
除了大語言模型外,文生圖模型也能跑在此芯P1上。該芯片可本地支持把復雜的提示詞轉化成一幅富有中國山水意境的精美圖片。此芯希望其AI PC芯片能處理不同類型的AI需求,受益于大內存帶寬和容量,將來擴展到更加復雜的任務。
此芯科技期待共建AI PC開放生態,包括用此芯P1打造Arm原生開發套件,重點布局異構AI端側生態,繼續貢獻國內外上游開源社區,推動產業聯盟和標準化。
結語:國產AI CPU迎來歷史機遇
生成式AI技術正推動個人計算體驗的重大變革,AI PC已經開啟PC市場新的增長空間,給企業和用戶帶來更高效的生產力和更自然的使用體驗。據市研機構Canalys預測,2027年全球AI PC出貨將超過1.7億臺,占比超過60%。
此前蘋果自研M1芯片已經在市場上證明了Arm架構芯片在高性能和高能效比上的出色表現,搭載高通驍龍X平臺的筆記本電腦進一步掀起了由Arm架構驅動的AI PC的熱潮。安謀科技銷售及商務執行副總裁徐亞濤認為,今天此芯同樣證明了Arm可以成為PC向AI革命的一個重要助力。
如今,隨著高能效通用CPU“此芯P1”走向商業化落地,AI PC芯片市場增加了一款有競爭力的國產芯片選擇。
孫文劍認為CPU正在經歷一個巨大的歷史變革:普通CPU變革為AI CPU,封閉生態變革為開放生態,高能耗CPU變革為高能效CPU。他相信在這場變革中,中國一定會誕生優秀的AI CPU企業,成為全球信息產業當中不可或缺的一環。


























