MLPerf最新AI芯片跑分：谷歌TPU和英伟达Tesla V100打破记录

智東西（公眾號：zhidxcom）
編 | 韋世瑋

導語：昨日，MLPerf基準測試公布了最新的測試結果，其中谷歌云和英偉達的硬件均打破以往AI訓練測試的記錄，展現了它們在訓練人工智能方面的強大性能。

智東西7月11日消息，昨日，MLPerf基準聯盟公布了最新一輪的基準測試數據，結果顯示，英偉達和谷歌云刷新了人工智能訓練時間的記錄。

MLPerf是一項用于測試ML（Machine Learning）硬件、軟件以及服務的訓練和推理性能的公開基準。它能幫助人工智能研究人員采用通用標準來衡量用于訓練人工智能的硬件、軟件的最佳性能和速度。

目前，MLPerf基準測試正迅速成為測量機器學習性能的行業標準，得到了來自40多家公司和研究人員的支持，如亞馬遜、ARM、百度、谷歌和微軟。

最新一輪的訓練基準測試由英特爾、谷歌和英偉達提交。

MLPerf最新AI芯片跑分：谷歌TPU和英偉達Tesla V100打破記錄

一、英偉達Tesla V100：80秒內完成圖像分類

MLPerf v0.6訓練基準測試套件包含六部分，即圖像分類、目標檢測、翻譯、測量、推薦和強化學習，基準測試結果則依據機器學習加速硬件的訓練性能，以及達成標準質量目標所需的時間。

據最終測試結果顯示，英偉達的Tesla V100 Tensor Core GPU使用了英偉達DGX SuperPOD，在80秒內完成了圖像分類的ResNet-50模型內部訓練。

相比之下，2017年英偉達使用DGX-1工作站來進行相同任務時，則需要8小時才能完成模擬訓練。

英偉達在訓練基準結果記錄上的突破，主要來自于軟件的進步。

該公司的一位發言人表示，在同一個DGX-2工作站的短短7個月內，他們的客戶已經能享受高達80%以上的性能提升，這些都歸功于他們生態系統正在做的所有軟件改進和工作。

在基準測試中，谷歌云的TPU v3 Pods在51秒內呈現了Transformer模型將英語文本翻譯成德語文本的創紀錄性能。

TPU pods 還利用ImageNet數據集，在ResNet-50模型的圖像分類基準中取得了創紀錄性能，并在1分12秒內完成了另一個目標檢測類別的模型訓練。

值得一提的是，今年谷歌云在5月份首次公測推出的TPU v3 Pods能夠利用超過1000個TPU芯片的能量。

此外，AlphaGo Zero模型的開源實現Minigo也參與了測試，Minigo在13.5分鐘內完成了強化學習，刷新了一項新記錄。

昨日發布的MLPerf v0.6是機器學習培訓性能基準套件的第二輪競賽結果，第一輪是MLPerf v0.5。

與v0.5相比，v0.6測試基準在圖像分類（ResNet）的質量目標、數據集和模型等方面都有了明顯的改進。

這最新一輪的訓練基準測試由英特爾、谷歌和英偉達提交，英偉達和谷歌曾在2018年12月分享了它們的第一個MLPerf訓練基準結果，展示了它們性能強大和快速的訓練人工智能模型的硬件。

此前，MLPerf在上個月發布了計算機視覺和語言翻譯推理基準。MLPerf推理工作組聯合主席David Kanter表示，MLPerf推理基準的初步結果將于9月進行審查，并于10月公開分享。

MLPerf基準聯盟的測試數據為大家展示了各大高科技公司在人工智能機器學習方面的潛力和優勢，給行業內的研究人員和人工智能市場提供了許多借鑒信息。

基于MLPerf基準測試的推動，各大公司不斷研發并提升硬件和軟件性能的競賽野心也將被激發，從而將進一步促進人工智能的發展。

MLPerf Training v0.6結果：//mlperf.org/training-results-0-6
文章來源：Venture Beat