智東西(公眾號:zhidxcom)
文 | Lina
人工智能熱潮的興起已然是不爭的事實,就在你讀文章的此時此刻,為期三天的ICLR國際學習表征會議剛剛落下帷幕。這場由全球兩位深度學習巨頭舉辦的學術研討會在近年來聲名鵲起,一躍已經成為人工智能領域的重要會議之一,谷歌、百度、Facebook、英偉達等各大公司爭相加碼贊助。(6位大牛21場演講,一文看盡最牛深度學習大會ICLR!)
而在這份贊助廠商名單上,一個中國創企尤為引人注目——深鑒科技。這是一家非常年輕的公司,履歷卻驚人地亮眼,公司內部聚集了無數清華、斯坦福的技術大牛,在各種學術研討會上拿獎拿到手軟。而且成立剛滿一年,不僅拿到了500萬美元的天使輪,還在今年年初敲定了數千萬美元的A輪融資,估值超過10億人民幣。
那么它是做什么的呢?既然贊助ICLR大會,那么自然與深度學習有關。
深度學習分為訓練(Training)和應用(Inference)兩部分,深鑒科技主要解決應用問題。簡單來說就是企業將自己的深度學習算法模型訓練好之后,由深鑒科技將其壓縮20-50倍并編譯,最終產品以板卡形式呈現。
深鑒科技基于的是FPGA平臺:與擅長訓練的GPU相比,FPGA功耗更小、整體性價比更高,更適合用于應用。但是由于FPGA的開發難度高、周期長,因此很多公司不愿使用。深鑒科技相當于給用戶提供了一個黑盒子,企業只需要提供輸入模型和數據,由深鑒科技提供應用層的FPGA解決方案。
智東西從很早之前就開始關注深鑒科技了。今年2月,深鑒科技首席科學家韓松的“深度壓縮”論文獲得了FPGA芯片領域頂級會議FPGA 2017的最佳論文獎;而更早之前,在去年的ICLR國際學習表征會議上,最佳論文獎也被深鑒科技斬獲。同年的另一篇最佳論文獎獲得者大家一定非常熟悉,那就是AlphaGo開發者——谷歌DeepMind。
巧合的是,深鑒科技與智東西同在人工智能創業勝地——五道口,而且公司離得特別近,也算是緣分。今天,智東西來到了公司內部,與創始人兼CEO姚頌仔細地聊了聊。
一、“姚老板”與他的師兄弟們(還有師父)
姚頌給人的第一感覺——很年輕,也很瘦。帶著眼鏡,穿著長袖的藍白細格子衫,人非常nice、很健談、也很好說話。
但。是。
請不要誤以為眼前只是某位面相清秀的普通理工科男生,這可是一個實打實的學術大牛。從小一路直升,高三直接保送進清華,進入電子系后大一就進了實驗室(理工科的同學大概可以理解這有多么厲害),本科階段不僅在斯坦佛訪問、微軟亞洲研究院實習、開發項目、發表論文、差不多就是把別人本碩博的事情一起做完了……此外,姚頌還擔任過電子系科協主席,主辦過電設等一系列科創賽事——也正是因為主席的位置十分類似公司的CEO,因此姚頌在大三時就有了個外號:“姚老板”。
而深鑒科技的另外幾位聯合創始人與合伙人則更是臥虎藏龍。
(左到右:單羿,汪玉,姚頌,韓松)
汪玉——也就是姚頌口中提到的“汪老師”,姚頌在大一時進的就是汪老師實驗室——清華電子系98級畢業生,現任清華大學電子工程系副教授、黨委副書記。從2006年開始研究FPGA,現在是ACM FPGA技術委員會亞太地區的唯一成員。
CTO單羿,清華電子系博士,04級本科,曾在地平線機器人擔任FPGA技術負責人、在百度深度學習研究院擔任高級工程師。
首席科學家韓松,清華電子系08級本科,斯坦佛博士在讀。韓松也就是我們上文提到的最佳論文獎獲得者,其研發的“深度壓縮(Deep Compression)”的技術,它不僅可以將神經網絡壓縮數十倍而不影響準確度,還可以使用“片上存儲”來存儲深度學習算法模型,減少內存讀取,大幅度減少功耗。
“我是里面年紀最小的一個,11級的。”“姚老板”說完這話,低頭笑了笑。
現在深鑒科技整個團隊有70人,其中將近一半都是清華出身,而且放眼望去……..幾乎全部都是男生。這家在2016年3月3日正式成立的公司,在剛成立一個月就拿到了金沙江創投與高榕資本的500萬美元天使輪融資,今年年初更是敲定了數千萬美元的A輪融資,投資方包括了FPGA的開山鼻祖——賽靈思(Xilinx)。
二、從GPU到FPGA,風起云涌的深度學習
人工智能的火熱已然有目共睹,從如雨后春筍般增長融資的各類AI創企、國內外無數巨頭高調進軍加碼、再到“人工智能”被寫入我國政府工作報告等諸多新聞中皆可見一斑。其實人工智能的概念早已有之,為什么近年如此火熱呢?
姚頌認為,深度學習和以往的人工智能不一樣,不僅已經能夠在某些領域超過了人類,而且原來人臉識別、微表情、醫療、SLAM等都有專家,每個領域的專家不能復用,但現在深度學習的AI框架可以把所有領域都囊括進去,對于硬件加速很友好,應用范圍很廣。
然而說起深度學習,大家最聯想到的還是GPU——五六年前,跑機器學習算法主要用的還是CPU,CPU通用性好,硬件框架已經很成熟,非常友好。然而,隨著機器學習及深度學習的運算量越來越大,CPU已經不能滿足人們的需求,人們進而把眼光轉向了GPU。
GPU不僅有更強大的并行處理能力,還有更加強大的控制數據流和儲存數據的能力,因此可以令神經網絡訓練的速度提升10-20倍,從而能夠將原本要數周甚至幾月的訓練時間縮短至數天。深度學習分為訓練(Training)和應用(Inference)兩部分,尤其是在訓練階段,其所需的數據計算之大,遠不是曾經CPU時代的人們敢于去想象的。
這對專注于GPU生產的英偉達來說,確實是一個好消息,英偉達在去年的股價飆升也證明了這一點。然而這消息對于全世界最大的CPU制造商英特爾來說,就沒那么友好了——不過,做不好我們可以買呀,2015年12月29日,踩著2015的尾巴與2016的前頭,英特爾宣布以167億美元全資收購FPGA/CPLD公司阿爾特拉(Altera),至于阿爾特拉和前文提到的塞靈思(Xilinx)的關系嘛,大概就像是肯德基和麥當勞。
咦?不是說好的GPU嗎?為什么聊起了FPGA?
FPGA(Field Programmable Gate Array)全稱“可編程門陣列”,是作為專用集成電路領域中的一種半定制電路而出現的,既解決了全定制電路的不足,又克服了原有可編程邏輯器件門電路數有限的缺點。
(賽靈思推出的UltraScale架構FPGA)
簡單來說, FPGA的“可編程”指的是可以用戶通過重新配置邏輯資源來不停嘗試,通過編輯不同的配置文件把同一個FPGA進行不同屬性的設置,直到獲得最佳方案,非常靈活。而深度學習作為一門尚在發展中的技術,FPGA的這種靈活、可編程、允許試錯的特性對它來說是非常友好的,這是第一點。
除了靈活性外,第二點則是功耗。一塊GPU的功耗動輒100W、200W,功耗巨大。雖然英偉達也推出了面向嵌入端的GPU設備(比如Jetson TX2系列,其標準功耗為7.5W/15W),但對于無人機、安防攝像頭這種功耗敏感型的硬件端來說則仍舊會存在功耗過大、發熱、過度影響電池續航等問題,而功耗能做到3W、4W的FPGA此處優勢凸顯。
第三點則是延遲問題,雖然GPU的運行速度比FPGA快,但是GPU的高性能來自于它的并行處理能力,訓練時效果很好,但在應用時一次性只能處理一張輸入圖像,優勢不能完全發揮,造成延時。
不過,GPU由于峰值計算性能高、內存接口帶寬高等優勢,依舊是目前深度學習訓練階段的最佳選擇。但在應用方面,FPGA的靈活、低功耗、而且價格相對低廉等優勢開始凸顯。目前國內外不少大公司開始逐漸注意到維護、采購、散熱、內部損耗成本等問題,開始逐漸將FPGA引入自己的系統內,比如去年亞馬遜和賽靈思合作,推出了基于FPGA的亞馬遜云服務、百度大腦使用了基于FPGA版的AI專有芯片、騰訊云也發布FPGA云服務器等等,市場接受度正在不斷提升。
三、產品落地:DPU與深度壓縮
雖然FPGA有種種好處,但是也存在一個大問題,那就是開發難度。由于傳統FPGA開發需要使用硬件描述語言(Verilog或VHDL)而不是傳統的計算機語言(比如C語言),程序員需要在FPGA公司提供的編譯器基礎上進行二次開發,造成了開發難度大、開發周期長(一般需要3-6個月)等問題,所以很多公司不愿意使用它。
深鑒相當于給這些不愿意直接使用FPGA的廠商提供了一個帶接口的黑盒子,廠商把自己的算法模型訓練好之后,將模型與數據通過接口傳入,由深鑒科技進行壓縮和編譯,生成的指令可以在FPGA上運行,廠商直接得到需要的輸出結果。
為此,深鑒科技提出了“DPU”這一概念,DPU(Deep Learning Processing Unit,深度學習處理單元),相當于把壓縮、編譯、執行的整個“黑盒子”過程具象化,最后的落地形態是一塊板卡。
(上:亞里士多德板,用于嵌入端。下:笛卡爾版,用于大數據端)
其中壓縮的這一環節尤為值得一提,由于跟GPU相比,FPGA在帶寬上存在一定劣勢。而深鑒科技的聯合創始人兼首席科學家韓松(對,就是FPGA 2017、ICLR 2016等大會上拿獎拿到手軟那個韓松)正在研究“深度壓縮”(Deep Compression)技術,他的獲獎論文中解釋了如何利用深度壓縮將神經網絡壓縮數十倍而不影響準確度,從而降低計算復雜度、存儲空間、以及帶寬對其的限制。
姚頌還告訴智東西,每套DPU并不需要根據不同公司而定制不同的板卡,只要是同類應用都可以復用。“比如公司A想要做車牌(識別),公司B想要做人臉(識別),這些公司只需要自己換不同的算法模型接入就行,DPU可以復用。”
(搭載有深鑒板卡的無人機)
目前,深鑒科技的合作伙伴主要集中在無人機、安防、數據中心這三個領域,代表企業分別是無人機廠商零度智控、上市公司東方網力、以及搜狗。比如在零度智控的無人機中載入板卡,為其提供人臉識別、跟隨、手勢照相等功能,功耗只有3W,不會對電力續航產生太大的影響。如安防攝像頭等的其他嵌入式端也是3W的功耗,數據中心應用的功耗則只有30-40W。公司下一步的拓展目標包括產品的平臺化與標準化、推進與其他大互聯網公司合作等,進一步推進產品成熟化。
四、“神人”云集
這里的“神人”值得不是學術大神——當然,辦公室里放眼望去,各類編程代碼高手云集,學術能力自然不必說了——這里的“神人”值的是那些特別有趣的人。
深鑒科技的整個公司氛圍有點像硅谷,氣氛和環境比較輕松,但工作節奏比硅谷緊湊多了——畢竟身處五道口。公司里的學術大神不少,體育大神也特別多。不僅有足球、籃球、羽毛球三個球隊,其中還有一個曾在國安青年俱樂部的足球大拿,跟所有人踢起來都不是一個量級的……
再比如另外一位研發總監,搞起研發來還是特別扛得住。之前在搞一個FPGA的項目時,剛好碰上他孩子剛出生。于是當時就看見他坐在客廳里,一邊抱著娃,一邊寫代碼。
可以,這很Work Hard, Play Hard。
姚頌本人自然是“神人”之一。按他的講法,“我自己比較躁動,比較喜歡新方式。”除了學術之外,社工、運動、音樂什么的,“都玩一點”。本科畢業后,姚頌獲得了美國卡內基梅隆大學(CMU)的博士offer,還伴有每年高額的學術獎金,但姚頌拒絕了。一開始時父母當然不同意,最后還是汪玉老師親自出馬才說服了姚爸姚媽。
不知道是不是口頭禪,在整個采訪過程中,姚頌經常說的一句話是——“這是一件非常好玩的事情”,恍惚間給人一種錯覺,像是深度學習、FPGA、神經網絡等等知識理論其實一點都不復雜,運營一間幾十近百人、估值過10億的技術公司也似乎輕而易舉。
結語:科學技術是第一生產力
當智東西問到“創業過程中最大的感觸是什么?”時,姚頌說,最大的感觸是,“一項理論從技術、到產品、到市場、最后收入,每一步都是非常重大的。”在一個商業產品中,純理論的技術部分可能只占的30%,后續的產品研發、商業落地。因此對于學術能力較強的團隊而言,如何掌控學術與商業的平和,為市場帶來有價值實戰產品,是需要認真思考的問題。
但話說回來,在人工智能領域,技術依舊是如今的第一生產力。云集了重多技術大拿的深鑒科技能夠在成立的這短短一年多里推出產品、與廠商達成合作、并且順利拿到融資并獲得高估值,成績單還是十分亮眼的。隨著深度學習的發展,國內外的各大企業也在逐漸擁抱FPGA,在這樣的浪潮下,深鑒科技專注于深度學習應用落地,瞄準FPGA的開發難這一痛點,前景值得期待。
在此之前,FPGA最大的應用在通信領域,開始被用在深度學習還是近年的事情。跟CPU、GPU這類已經經歷過多年市場驗證的產品不同,一方面FPGA還算是一個較為小眾的市場,哪怕是巨頭賽靈思,其市值也只在150億美元左右(截至發稿,英偉達市值約570億美元),推進產業接受仍需要時間;另一方面FPGA仍舊是一個對人力資源要求較高的技術,在公司未來的擴張過程中,如何更好地招攬FPGA人才、人力成本是否會進一步增加,也是可能面臨的挑戰之一。
硬創先鋒
挖掘全球最具潛力的智能創業項目
項目投遞:微信添加hawkren001






