智東西(公眾號:zhidxcom)
編 | 海中天
導語:PCMag記者在谷歌總部呆了一天,深入了解AI與機器學習是如何在谷歌內部滲透的。他們采訪了許多高管,谷歌的目標就是圍繞AI打造一個生態系統,將重復的人工處理變成自動流程,用AI為企業服務。
Makoto Koike是日本一名農民,種植黃瓜。之前他是嵌入式系統設計師,在日本汽車行業工作,2015年他回到故鄉,幫助父母種黃瓜。很快,他就發現要給黃瓜分類很麻煩,農民要根據顏色、形狀、尺寸、特點(比如是否多刺)給黃瓜分類,工作很棘手,比種黃瓜還要費力。谷歌開發了AI軟件AlphaGo,受到谷歌的啟發,Makoto Koike想將任務變成自動化流程。
現在企業已經開始通過各種方式將AI應用于實際,不過還沒有人看到過類似的技術出現過。Koike之前從沒有從事過AI技術方面的工作,有了開源TensorFlow機器學習技術,他開始將黃瓜的圖片輸入系統。計算機視覺算法已經可以識別對象,深度學習可以根據黃瓜的細微差別訓練TensorFlow,Koike意識到它可以用來識別、分類蔬菜,精準度很高。然后,Koike只用了TensorFlow和一臺便宜的Raspberry Pi 3計算機就制作出自動分類機器,今天農場還在使用這臺機器。
市場上有許多的開源算法和工具,TensorFlow只是其中之一,企業和開發者想用AI解決一些問題,TensorFlow可以為他們的工作帶來革命性影響。谷歌將這些技術和應用程序界面(API)放進自己所做的一切事情中,將機器學習植入產品,從根本上重新定義了軟件的運行流程。
最近,PCMag拜訪了Googleplex(也就是谷歌總部),采訪了一些高管,他們來自G Suite、谷歌云平臺(Google Cloud Platform)、機器學習先進解決方案實驗室(Machine Learning Advanced Solution Lab,ML ASL),了解谷歌是如何用AI技術重塑自我的。
AI無處不在
假設你的一個客戶遇到了問題,公司服務部門的一名代理用Google My Business與客戶在網上溝通,Google My Business是一個聊天功能,目前還處在試點階段。要幫助客戶解決問題,用戶需要將一些敏感個人數據發給代理。現在假設客戶是你的祖母。客戶服務代表要求你的祖母發一些數據,少量的數據,你的祖母在聊天過程中上傳一張圖片,一張社會保障卡的圖片,但是她提交的信息比要求的多。
現在谷歌不是這樣做的,它會將個人身份信息(PII)歸檔,帶有社會保障號的圖片出現之后,其它PII信息也會自動匹配。代理看不到多余的信息,也不會有任何數據放進谷歌加密檔案。在加州谷歌山景城總部,公司員工演示了Google My Business的新功能,到底機器學習算法是怎樣完成使命的呢?谷歌揭開了神秘的面紗。
谷歌云計算信任與安全營銷主管Rob Sadowski解釋稱,自動編輯是通過谷歌數據損失預防(DLP) API完成的,它是底層技術,給敏感數據分類是表面。算法還可以用同樣的方式處理一些數據,比如信用卡號碼,如果號碼是假的,它可以分析模式,進行識別。谷歌想將AI放進體驗中,讓企業、開發者(比如Koike)有資源做同樣的事情,這只是谷歌精妙策略的一個例證。
有許多科技巨頭正在嘗試將互聯智能層植入軟件,不只是谷歌這樣做,還有亞馬遜和微軟,不過與它們相比谷歌的云智能工具和服務無疑寬泛很多。分析谷歌產品,你會發現谷歌助手、多種機器學習系統、計算機視覺API無處不在。
谷歌搜索在RankBrain AI系統使用了機器學習技術,根據眾多變量處理精煉提問、重新排序、聚合數據,不斷改進搜索結果。谷歌Photos用計算機視覺技術拼接照片,將它化為回憶,將同一個地點的多張圖片變成全景圖。Inbox可以自動生成“智能回復(Smart Replies)”,供用戶選擇,通過將相似類型的郵件捆綁,讓高度相關的郵件突出顯示。新的谷歌Allo聊天APP內置了谷歌助手。還有更多的工具使用了AI技術。
所有這些APP都是在谷歌云基礎設施上運行的,谷歌在數據中心使用了機器學習技術,用它降低能耗,根據負載、天氣信息調整冷卻泵。Sadowski說,在谷歌的安全戰略中,機器學習也是最后的防護層,谷歌在安全堆棧中用機器智力、風險評分判斷系統使用可預測分析是否存在缺陷。
Sadowski解釋稱:“谷歌開發了許多機器學習和AI模型,公司從安全角度著眼將所有模型優化。與IT大多的部分相比,安全是變化比較大的。3年或者4年前,有些產品是安全基礎設施的核心,比如防火墻、端點防護,這些技術仍然很重要,但是我們想提供更深的防護,讓它規模化應用,將它作為默認技術放置在多租戶基礎設施上,每天可以有幾百萬活躍用戶。”
“我們從底層數據中心硬件開始起步,比如最新的Titan芯片。”Sadowski繼續說,“在此之上是應用服務、身份驗證,數據與通信完全加密。再上層是用戶身份。如何才能7天24小時監控、偵測、響應事件,這是最后的防護層。例如,如果要讓用戶通過身份認知代理遠程接入,我們就會有類似的技術確保安全。它是一項可編程的DLP服務,能夠發現并防范數據泄露,幫助管理數據,增強安全性。我們的目標是讓這些功能變得更容易使用,變成可消費服務,大規模推廣。”
智能G Suite
機器學習技術已經植入谷歌G Suite生產應用中。G Suite產品管理主管Allan Livingston介紹了一些谷歌所采用的方法,這些方法使得G Suite更智能、更能感知環境,甚至連用戶都意識不到。
Livingston解釋稱:“你可以想像一下,G Suite將所有應用以更自然的方式整合在一起。你從其中一個應用開始工作,以適當的方式過渡到其它應用。你在Drive中打開Gmail附件,它將你帶到Docs,完全自動。”
“我們努力站在用戶的角度思考,當中會涉及到機器學習。我們最先從Gmail智能回復開始,然后在Inbox取得了成功,接下來又在Docs、Sheets、Slides中引進了Explore功能。”
Explore于去年秋天推出,它將自然語言處理技術應用于程序內生產體驗。例如,在Docs中,Explore可以根據文檔內容瞬間提供建議,還可以自動推薦相關主題和資源。在Slides中,它可以生成設計建議,讓用戶精簡陳述格式。Livingston解釋了Explore是如何用機器學習簡化數據分析、商業智能情報的。
“許多用戶不知道數據透視表是什么,也不知道如何利用它將數據表視覺化。” Livingston解釋稱,“假設你要處理一名客戶的銷售數據,每一行都是一件已經銷售的商品。Explore允許你用自然語言提問,比如:‘黑色星期五最暢銷的是什么商品?’系統會回答說:‘你賣了563條褲子。’在數據分析過程中我們可以節省時間,因為決策是以數據作為基礎的,我們用機器學習以更自然的方式提高解決普通問題的能力。”
Livingston還說,谷歌準備將這種機器學習云搜索功能提供給第三方,它開始圍繞新技術建立一個生態系統。谷歌的總思路實際上與AI的實用性有關:讓人工處理實現自動化,將用戶解放出來,讓他們從事更有創造性的工作。這種思路實際上已經成為大多機器學習APP的核心:讓重復性業務流程自動化,讓日常任務(包括黃瓜分類)變成自動化流程。
“在商業行為中,與消費者溝通時,用戶已經使用這些自然交互模式。向云計算和移動生產力轉移改變了人們的工作方式,而機器學習技術又是其根本。”Livingston說,“因為我們在機器學習方面有優勢,因為我們的產品可以作為基礎提供服務,因為所有數據全都放在我們的云計算網絡中,所以我們占據了最佳位置,可以使用它,以規模化方式應用。”

為機器學習革命提供動力
谷歌在AI方面所做的一切工作都是以API、算法、開源工具作為根基的。谷歌TensorFlow 資源庫是GitHub平臺上最流行的機器學習工具,許多應用程序采用,比如Koike黃瓜分類程序。整套API就是谷歌云計算的根本,正是它為谷歌APP和服務的每一個AI功能提供動力。
谷歌研究與機器智能產品經理Francisco Uribe為引擎核心工作,正是這個核心改變了谷歌的運行模式。Uribe掌管谷歌ML ASL,它是一個實驗室,谷歌機器學習專家直接與企業合作,將AI解決方案植入企業。通過谷歌API和云計算機器學習引擎,實驗室與企業攜手合作,幫助企業在生產過程中訓練、部署模型。
Uribe在AI領域工作了10多年。他成立了BlackLocus,這是一家數據創業公司,為零售商開發自動比價引擎,2012年被家德寶收購。之后Uribe加入谷歌,在搜索廣告團隊工作了4年,用機器學習改進廣告體驗。2016年,他進入ML ASL,負責開發工作,成為Launchpad Accelerator的導師。Uribe說,企業和開發者積極使用谷歌工具,他感到相當驚訝。
“我們看到工具應用于多個領域,包括健康護理、金融、零售和農業。”Uribe解釋說,“我們正在努力幫助客戶增強感知能力。語音翻譯、圖像識別、視頻API、自然語言:它們都是民主接入機器、深度學習算法的組成部分,這些算法終于變得適用了。”
ML ASL與匯豐銀行合作,用機器學習解決方案反制洗錢活動,預測信用評分。ML ASL還與聯合服務汽車協會(USAA)合作,幫它訓練機器學習工程師,將技術應用于保險領域。eBay用谷歌工具訓練ShopBot 數字助手。Uribe解釋稱,當ML ASL與企業合作時,整個過程包含4個重要部分。
“機器學習工作的要求很高,你需要強大的計算產品才能滿足要求,你還要用GCP的分布式光纖骨干網絡傳輸數據,以很高的效率從一個節點傳輸到另一個節點。”Uribe說,“我們有云機器學習引擎(Cloud Machine Learning Engine),可以幫助客戶訓練模型,我們利用Kaggle社區幫助客戶處理數據,那里有800名活躍的數據科學家。最終,你還需要人才,在研發方面,我們有Brain Residency Program,這個項目用復雜的機器學習課程培訓工程師。它們都是組成部分,共同幫助客戶構建智能應用。”
所有這些東西都放進了開源社區和第三方生態系統。年初時,谷歌宣布舉辦機器學習創業公司挑戰賽,機器學習創業公司如果拿獎,最高可獲50萬美元投資。Uribe談到了一些創業應用,這些應用是Uribe在谷歌技術中看到的,未來也許會出現其它的變化。
“假設你有一家客戶服務分析公司,你們用語音API轉化語音呼叫,然后分析情感,提高客服質量。”Uribe說,“到了外國,你可以用視覺API拍一張街道標志的照片,然后翻譯API就可以實時在APP中將內容翻譯出來。它不只可以提高效率,還可以創造新穎、獨特的用戶體驗。”
Uribe認為,因為TensorFlow等工具的存在,在市場上大規模推廣機器學習技術變得更容易了。谷歌是什么?谷歌如何開發產品?現在這些技術已經成為核心,不只如此,Uribe還相信廣泛存在的機器學習技術可以優化業務、創造新的營收流、發明新型智能APP。
他還說:“我們可以將它視為新的工業革命,這些工具可以大幅提高效率,帶來前年未有的體驗。創業公司積極采用,我們感到驚訝。看看日本種黃瓜的農民,他用TensorFlow開發一個模型,根據模樣、尺寸、紋理等標準給黃瓜分類,然后自己制作特殊硬件執行。這是一種民主化進程,讓人驚嘆,我們現在只是觸及表面。”



