智東西(公眾號:zhidxcom)
編譯 | 屈望苗
編輯 | 江心白
智東西4月15日消息,據外媒報道,美國AI數據標簽企業Scale AI于當地時間4月13日宣布,最新一輪融資后該公司估值73億美元。
Scale AI由時年19歲的Alexandr Wang在2016年創立,先后為美國自動駕駛汽車公司Waymo、豐田汽車Toyota、美國網約車公司Lyft等客戶公司提供用于機器學習的數據標記服務。

▲Scale AI創始人Alexandr Wang
一、19歲小伙創立,曾簽下美國軍方大單
2016年,年僅19歲的Alexandr Wang從麻省理工大學輟學,同年在完成了硅谷創業扶持公司Y Combinato的孵化項目后,和22歲的Lucy Guo一同創辦了Scale AI。
Alexandr Wang出生在美國新墨西哥州,父母均是物理學家。早在高中的時候,Wang因在編程比賽上的出色表現,陸續接到科技公司的工作邀約,并在硅谷開啟了自己的職業生涯。
在接受采訪時,Wang回憶道,“我在硅谷工作的這段時間里,看到人工智能領域目前存在的形形色色的問題,因而了解到機器學習的重要性。”

▲Alexandr Wang(左一)和Scale員工
Scale幫助企業整理和標注用來訓練AI系統的數據,這個過程通常需要為數萬個示例添加標簽。
從最初為自動駕駛汽車處理圖像和視頻數據,發展到如今為金融、物流企業和政府提供廣泛的視覺和自然語言數據支持,Scale已經成為了這一領域主要的公司之一。
Wang告訴美媒Fortune,該公司去年的銷售額翻了一番,并且有望在12個月內實現1億美元的收入。
2020年9月,這家年輕的獨角獸企業首次和美國軍方達成合作,一舉拿下美國國防部的9100萬美元大單,協助美國軍方試驗、開發以及更新用于機器學習和AI的標注數據集。
在線支付服務商PayPal和社交網站Pinterest都曾是Scale的客戶,該公司還曾與豐田、通用汽車等主要汽車制造商合作。此外,該公司的員工人數也從去年的約100人增至300人。
機器學習正在逐漸取代傳統的軟件編程,來幫助公司將任務自動化。“數據就是新的代碼。數據是系統建設、培訓和測試的基礎,也是關鍵,”Wang說,“公司需要利用和操縱數據,就像他們過去利用和操縱代碼一樣。”
二、訓練AI“黑科技”,數據標簽助機器學習
創建五年以來,Scale的業務已經從簡單的數據標記發展為一整套基于軟件的服務。它可以幫助企業收集、注釋、管理和清理數據,以及建立和監控基于這些數據的機器學習模型。
其中,一個名為Nucleus的軟件包可以讓客戶在數據中快速找到可能會降低AI算法性能的錯誤標簽,并給數據添加新標簽,對AI系統的弱點進行更多訓練來改進其性能。

▲Scale Nucleus系統示意圖
“在所謂的90%或95%準確率下,失敗率也并不是均勻分布的,”特斯拉前高級機器學習工程師、如今領導Scale Nucleus團隊的羅素·卡普蘭(Russell Kaplan)說。
所有的AI系統都有統計偏差,即犯錯的傾向。這些錯誤通常涉及“邊緣情況”,即在訓練數據中沒有充分體現的罕見事件。
卡普蘭將Nucleus比作軟件調試工具,但它被用于數據,而非軟件代碼。
三、半年內估值翻一倍,形勢向好
美國時間4月13日,Scale宣布已在最新一輪投資中籌集3.25億美元。此次融資使該公司自2016年成立以來籌集的風險資本總額超過6億美元。
2019年8月,Scale獲得美國風投機構創始人基金(Founders Fund)的1億美元投資,憑借10億美元的估值一躍成為硅谷最年輕的獨角獸企業之一。Scale?AI還陸續收到了Index Ventures、Accel、Coatue Management的投資。
2020年12月,Scale在上一輪融資后估值1.55億美元,而此輪融資后其估值已經是這一數值的兩倍多。
最新一輪的投資由美國投資公司Dragoneer、Greenoaks Capital,以及科技投資公司Tiger Global領投,投資管理公司Wellington Management和Durable Capital也參與了這輪融資。
Wang在接受采訪時透露,公司目前沒有計劃上市,但“一直在關注市場”。亞馬遜前高管杰夫·威爾克(Jeff Wilke)將作為CEO特別顧問加入Scale。
結語:由機器學習衍生,數據標注自動化
隨著AI技術的發展,用于機器學習的數據標簽催生了一個全新的行業。幫助企業對數據進行標簽的公司如雨后春筍般涌現。對于想從人工智能熱潮中獲利的投資者來說,數據標簽和管理已經成為一種流行的“掘金”方式。
舊金山初創公司Labelbox運營著一個軟件平臺,幫助企業管理數據標簽任務,這家公司的融資總額達到了3900萬美元。還有特拉維夫的初創公司Dataloop,在2020年10月完成了1100萬美元融資。
AI算法大大提高了數據標注的效率,這種算法為主、人工為輔的標注模式指明了未來機器學習訓練數據整理的趨勢。
來源:Fortune