智東西(公眾號:zhidxcom)
作者 | ZeR0
編輯 | 漠影

在生成式AI競賽中,亞馬遜云科技(AWS)多少有些“另類”。它不像其他云大廠那樣強調自研模型的頂尖性能,而是早早推出一個大模型貨架,集郵般擺上了各家頭部大模型,供客戶挑選。

沒有一個模型能包辦一切”,這個被亞馬遜頻繁強調的理念,已經逐漸深入人心。而在今年的年度云計算產業盛會re:Invent上,亞馬遜云科技卻又意外地發布全新大模型系列Nova的6款前沿模型,而且劇透了明年將發布的兩款特別模型——語音到語音、任意到任意(Any-to-Any)。

如何跑贏生成式AI競賽?云計算大廠揭秘組合拳:自研大模型只是開胃菜

這意味著亞馬遜云科技在重押美國大模型獨角獸Anthropic的同時,對自研模型也并未松懈。

在re:Invent期間,亞馬遜云科技生成式AI全球副總裁兼總經理Vasi Philomin與智東西等少數媒體就這些問題進行了深入交流。他談到當前文本模型需求最大,語音到語音也非常流行(如實時同傳翻譯),任意到任意則是更遠的未來。

任意到任意模型屬于多模態到多模態,用戶可以輸入文本、語音、圖像或視頻等多種形式的內容,并相應地輸出文本、語音、圖像或視頻。

Vasi Philomin向我們解釋說,任意到任意模型適用于變化很多的情況,比如不能確定是圖像還是視頻類型。“你不能把任意到任意模型用作文本到文本的模型,”他強調道,“它可能成本挺高,但效果反而不好。”

如何跑贏生成式AI競賽?云計算大廠揭秘組合拳:自研大模型只是開胃菜

最強未必是最優解,好用才是硬道理。

整場re:Invent大會都在源源不斷地傳遞一個信號——亞馬遜云科技的生成式AI競爭力勝在全面,有琳瑯滿目的大模型品類,還有加速從訓練到推理的各種工具“套餐”,以及圍繞平臺、存儲、網絡、數據庫的一系列升級……一切變動都指向一個目的,即讓云客戶更快更方便地用生成式AI產生價值。

在沙利文大中華區總監李慶看來,本屆re:Invent大會上的新發布更加側重于產品的實際應用和工具優化,這表明過去一年中,全球用戶正在積極使用亞馬遜云科技進行生成式AI應用的探索和創新。

有兩個方面令他印象深刻:一是隨著全球企業對生成式AI的深入應用,數據不僅實現跨區域的傳輸與協同,更實現跨地域、跨區域的深度連接;二是亞馬遜云科技進一步優化生成式AI的應用,從數據存儲、治理到管理的全流程提升,旨在簡化AI對數據的使用,同時強化模型功能、增加AI Agent管理和應對模型幻覺的功能。此外,新發布的Amazon Nova大模型家族備受期待,這一系列的模型和亞馬遜云科技的開放選擇理念將為用戶帶來更多創新機會,進一步推動AI的發展。

一、大模型貨架上新:不會厚此薄彼,提供試用機會

新發布的Nova基礎模型包括MicroLiteProPremier模型,Micro是純文本模型,后三者都是多模態模型,還有文生圖模型Canvas和文生視頻模型Reel這些模型都支持微調和蒸餾,還與Amazon Bedrock的知識庫深度集成,可用于檢索增強生成(RAG)。

如何跑贏生成式AI競賽?云計算大廠揭秘組合拳:自研大模型只是開胃菜

Vasi Philomin告訴智東西,亞馬遜云科技的每個新模型、新服務在面世前都會經過內部討論流程,Bedrock寓意“基石”,Nova寓意“新”。他說亞馬遜云科技不會公布模型參數的情況,怎么選擇取決于客戶想要擁有怎樣的靈活度。

“我們對所有的模型都一視同仁。”作為Amazon Bedrock的負責人,Vasi Philomin稱自己的團隊非常中立,不會在模型間厚此薄彼。

定價由模型提供商設置,不同情況下有很多不同的考量。亞馬遜云科技沒有去綁定某一個特定的模型,始終向客戶提供選擇的空間。

大模型只是生成式AI應用創新的一部分。亞馬遜云科技的全托管AI平臺Amazon Bedrock除了提供了各種大模型外,還有專門的試用服務。客戶可以在嘗試后根據效果和價位進行綜合考慮。

此外,亞馬遜云科技提供有模型版本政策,在模型生命周期結束的時候(即新產品不再使用時),會再給客戶6個月的時間。在Vasi Philomin看來,一些新老版本替代會占用計算資源,從成本、效率的角度不見得劃算,換個新的可能更省錢。

亞馬遜云科技對Nova模型性價比很有信心,稱它們比Amazon Bedrock中的其他領先模型大約便宜75%

如何跑贏生成式AI競賽?云計算大廠揭秘組合拳:自研大模型只是開胃菜

二、Amazon Bedrock五大功能:挑選模型,結合數據,構建Agent

在re:Invent大會上,亞馬遜CEO Andy Jassy分享了亞馬遜內部構建近1000個生成式AI應用所積累的三條經驗:

1、當生成式AI應用達到一定規模,計算成本的重要性就凸顯出來。客戶普遍希望獲得更高性價比。

2、打造一個真正優質的生成式AI應用程序頗具難度,除了有好模型,還要設置恰當的“護欄”,保證消息傳遞流暢,擁有合適的用戶界面,讓用戶用起來不卡頓,而且要具備合理的成本結構。

3、不會出現一種工具一統天下的情況。開發者并沒有一窩蜂地選用性能最頂尖的模型,會采用不同模型,也會采用一些自研模型。

亞馬遜云科技在2023年9月推出的全托管AI平臺Amazon Bedrock則做到了上述能力的集合。據Vasi Philomin分享,該平臺已發展成亞馬遜云科技目前增長速度最快的服務。

如何跑贏生成式AI競賽?云計算大廠揭秘組合拳:自研大模型只是開胃菜

亞馬遜云科技CEO Matt Garman稱Amazon Bedrock是目前構建和擴展生成式AI應用最簡便的方式,尤其擅長為客戶提供將生成式AI集成到生產應用程序中所需的一切要素。

Amazon Bedrock的定位是幫助用戶更好地試用模型,主要有五大功能:1)選模型;2)找到成本性能和準確性的一個平衡;3)集成業務數據;4)要集成業務的安全性;5)構建Agent。

該平臺的多項發布和創新,也圍繞這五大功能展開。

如何跑贏生成式AI競賽?云計算大廠揭秘組合拳:自研大模型只是開胃菜

首先在選模型上,除了亞馬遜云科技新發布的自研大模型Nova系列以及來自全球9家領先AI公司的高性能基礎模型外,這家云計算大廠還推出了Amazon Bedrock Marketplace,提供來自100多個新興和專業基礎模型,支持客戶用統一API來調用并利用Amazon Bedrock中的能力來構建應用。

如何跑贏生成式AI競賽?云計算大廠揭秘組合拳:自研大模型只是開胃菜

為了讓挑模型更省事,Amazon Bedrock智能提示詞路由功能可以動態地將請求路由到最有可能以最低成本出最佳響應的模型,在不影響準確性的情況下能將成本降低30%。這樣開發人員就不用花大量時間來試驗和找到最適合每個用例的模型。

如何跑贏生成式AI競賽?云計算大廠揭秘組合拳:自研大模型只是開胃菜

其次在尋求業務需求、專業知識、預算與模型精度、成本、延時的平衡方面,模型蒸餾很有用。

模型蒸餾將特定知識從一個大而準確的教師模型蒸餾出一個更小但在特定場景中非常高效的定制模型。使用新推出的Amazon Bedrock模型蒸餾,蒸餾過的模型相比被蒸餾的模型,運行速度能夠快500%,成本降低75%,而且Amazon Bedrock會幫助搞定所有相關工作。

如何跑贏生成式AI競賽?云計算大廠揭秘組合拳:自研大模型只是開胃菜

Amazon Bedrock新發布的延遲優化推理選項提示詞緩存功能也能進一步降低延遲,大幅縮減成本。

如何跑贏生成式AI競賽?云計算大廠揭秘組合拳:自研大模型只是開胃菜

獲得合適模型后,下一步是將企業數據與智能模型相結合。

將數據添加到模型中并進行整合的一種熱門方法叫檢索增強生成(RAG),有助于模型基于企業數據提供更相關、更準確且更具定制化的回應。

如何跑贏生成式AI競賽?云計算大廠揭秘組合拳:自研大模型只是開胃菜

亞馬遜云科技在今年早些時候推出了Amazon Bedrock知識庫功能,它屬于托管的RAG索引,能將所有的數據攝取、檢索及增強工作流實現自動化,無需用戶自行對這些環節進行全面管理。

如何跑贏生成式AI競賽?云計算大廠揭秘組合拳:自研大模型只是開胃菜

客戶只需將知識庫指向自己的數據源,它就會自動將其轉換為文本嵌入,然后存儲到一個向量數據庫中。這樣客戶就能隨時進行自動檢索了,并且所有的檢索結果都會自動包含引用信息,方便用戶知曉信息來源、提升理解程度。

知識庫已經是Amazon Bedrock中最受歡迎的功能之一,并在持續添加新功能,比如新增對向量數據庫結構化數據檢索GraphRAG的支持。

如何跑贏生成式AI競賽?云計算大廠揭秘組合拳:自研大模型只是開胃菜

Amazon Kendra GenAI Index則能為知識庫提供語義準確性高的托管檢索方案,內置超過40多個企業數據源。

如何跑贏生成式AI競賽?云計算大廠揭秘組合拳:自研大模型只是開胃菜

Amazon Bedrock知識庫支持結構化數據檢索、GraphRAG,可查詢各種來源的所有結構化數據,自動生成知識圖譜。新發布的Amazon Bedrock Data Automation功能則可以自動將非結構化的多模態內容轉換為結構化數據,無需寫代碼,讓將多模態內容用于生成式AI的過程變得更容易。

如何跑贏生成式AI競賽?云計算大廠揭秘組合拳:自研大模型只是開胃菜

導入自己的企業數據后,需要考慮安全性和設定AI應用程序的功能邊界。

對此亞馬遜云科技推出了Amazon Bedrock Guardrails護欄功能,用于輕松定義應用程序的安全性,并實施負責任的AI檢查。使用這個功能,你可以限制AI應用只在特定領域回答問題。

如何跑贏生成式AI競賽?云計算大廠揭秘組合拳:自研大模型只是開胃菜

針對模型幻覺問題,可行技術之一是自動推理,亞馬遜云科技在諸多幕后服務中都運用了該技術。這是一種能夠從數學角度證明某事正確的AI形式,通常被用于驗證系統是否按照既定要求運行,尤其適用于系統覆蓋面大到無法人工逐一查看,且有關于系統運行方式的知識庫的場景。

最新推出的是Amazon Bedrock自動推理檢查功能,可以對模型所做出的陳述進行準確性檢查,防止因模型幻覺而導致錯誤。

如何跑贏生成式AI競賽?云計算大廠揭秘組合拳:自研大模型只是開胃菜

亞馬遜云科技還發布了Amazon Bedrock Guardrails多模態毒性檢測功能,能夠篩查非結構化數據中可能包含的潛在有害內容。

最后涉及到怎么利用優質數據采取行動。

亞馬遜云科技此前推出了Amazon Bedrock Agent功能,讓構建智能體變得更容易。客戶只需用自然語言描述想要Agent完成的任務,它就能快速構建出來。被構建出的Agent可以處理銷售訂單、編制財務報告、分析客戶留存情況等任務。背后用到的模型推理技術使Agent能分解工作流程,調用正確的API來執行操作。

如何跑贏生成式AI競賽?云計算大廠揭秘組合拳:自研大模型只是開胃菜

在此基礎上,針對多智能體并行操作的任務,亞馬遜云科技又推出了Amazon Bedrock多Agents協作功能,能夠構建、部署和編排多個Agents,協同處理復雜的多步驟任務。

如何跑贏生成式AI競賽?云計算大廠揭秘組合拳:自研大模型只是開胃菜

跟前面的做法差不多,客戶可以創建一個專為特定個性化任務設計的Agent,再創建一個監督Agent,它就好比復雜工作流程的“大腦”,負責協調分配、確保多Agent之間能夠有效協作,并能設定哪些Agent能訪問機密信息,把原本難以協調的工程任務變得簡單易行。

總體來說,Amazon Bedrock的功能不止是為了方便客戶獲取業界先進模型,而是內置了很多配套工具和工程化能力,可以讓實際業務與生成式AI結合的操作過程更方便、結果更奏效。

三、下一代Amazon SageMaker:數據分析和AI需求的統一訪問中心

生成式AI應用創新要取得成功,需要有AI ready的數據。因此,亞馬遜云科技發布了新一代Amazon SageMaker,從產品及品牌方面將其重新定位為“所有數據、分析和人工智能需求的中”。

如何跑贏生成式AI競賽?云計算大廠揭秘組合拳:自研大模型只是開胃菜

很多云客戶在數據的治理、發現、處理、分析以及生成式AI應用創新方面的需求越來越融合。對此,亞馬遜云科技發布了Amazon SageMaker Unified Studio。這是一個單一的數據和AI開發環境,整合了在亞馬遜云科技中分析師和數據科學家所使用的各種服務、查詢編輯器、可視化工具,以便客戶訪問組織中的所有數據,并使用最適合的工具對其進行操作。

亞馬遜云科技還推出了面向應用程序的Zero-ETL,幫客戶無需構建和管理數據管道,即可分析存儲在許多最受歡迎的第三方SaaS應用程序中的數據。

另一個新發布的Amazon SageMaker Lake House兼容Apache Iceberg,針對所有結構化和非結構化數據源提供單一界面,跨不同數據源提供簡單統一的數據接入與訪問控制。客戶可以在Unified Studio中輕松處理所有數據,也可以直接從任何支持Apache Iceberg的第三方AI或分析工具或查詢引擎訪問該功能。

為了一站式解決生成式AI全生命周期的問題,Amazon SageMaker AI將大數據分析、機器學習、模型開發和生成式AI方面的經驗融合到一個統一平臺中,統一了數據、分析和AI工作流,從而幫助消除機器學習和分析生命周期中的重復勞動。

如何跑贏生成式AI競賽?云計算大廠揭秘組合拳:自研大模型只是開胃菜

針對大規模參數帶來的模型訓練和推理挑戰,亞馬遜云科技推出Amazon SageMaker HyperPod靈活訓練計劃任務治理功能,以優化計算資源管理。

靈活訓練計劃基于Amazon EC2容量塊,根據時間線和預算創建最佳訓練計劃,自動預留容量,設置集群,創建模型訓練作業,能夠為數據科學團隊節省數周訓練時間,最大化計算資源利用率,可節省多達40%的成本。

任務治理功能針對管理跨團隊的和項目的計算資源的挑戰,通過自動化生成式AI任務的優先級排序和管理,確保分配給最高優先級任務并按時完成,從而進一步提高開發效率并降低成本。

這兩個功能能夠大幅提高訓練和推理工作負載部署的靈活性和對底層硬件資源的使用,讓底層硬件資源發揮出更好效能。

此外,亞馬遜云科技宣布合作伙伴的AI應用已在Amazon SageMaker上可用客戶無需預配或管理基礎設施,可加速模型開發生命周期,并有數據安全和隱私保障。

接下來一年,亞馬遜云科技還將為新的Amazon SageMaker添加大量新功能,如AutoML、低代碼體驗、專業化AI服務集成、流處理和搜索,以及Zero-ETL的更多服務和數據訪問。

四、生成式AI助手Amazon Q再進化,提升企業生產力

Amazon Q是在Bedrock上搭建起來的一個生成式AI助手應用。即使你沒有寫過一行Python代碼,你也可以用自然語言簡單陳述業務問題,它會指導你完成構建機器學習模型的過程。

如何跑贏生成式AI競賽?云計算大廠揭秘組合拳:自研大模型只是開胃菜

其中Amazon Q Developer是軟件開發方面的生成式AI助手,最新推出了3款全新自主Agent,能幫助開發人員生成單元測試、文檔、代碼審查

如何跑贏生成式AI競賽?云計算大廠揭秘組合拳:自研大模型只是開胃菜

針對從Windows、VMware進行現代化改造的情況,亞馬遜云科技提供了現代化Windows.NET應用加速VMware工作負載主機遷移的功能,以及首個支持IBM z/OS的主機遷移解決方案,可以大幅縮短遷移時間和成本,并顯著降低風險。

在運營環節,亞馬遜云科技通過提供Amazon Q Developer Investigate issues across your Amazon environment in a fraction of the time功能,來幫助更輕松地排查問題。

企業級生成式AI助手Amazon Q Business可連接不同的業務系統、企業數據源,支持跨越各種數據庫與所有企業數據進行對話。Q Business為企業數據創建了一個索引,可以從Adobe、Microsoft Office、SharePoint、Gmail、Salesforce、ServiceNow等源中去索引過去一年的數據,并對所有數據保持高度安全、控制用戶權限。

最新發布的功能是將Amazon QuickSight和Amazon Q Business的數據結合,以一種視圖呈現,通過自然語言與Q系統對話,快速生成商業報告和數據分析,協助客戶做出更好的決策并提升業務效率。目前絕大多數信息都是通過商業智能系統來訪問的,已有超過10萬的客戶在使用Amazon QuickSight來滿足分析需求。

如何跑贏生成式AI競賽?云計算大廠揭秘組合拳:自研大模型只是開胃菜

亞馬遜云科技提供了一套全新的Q Business?API,以便獨立軟件供應商訪問在自有軟件中集成Amazon Q Index。

針對一些涉及多個應用程序、審批環節和手動輸入的復雜工作流,亞馬遜云科技新發布的Amazon Q Business Automate能夠幫助創建跨團隊和應用程序的自動任務,通過使用一系列高級Agent來創建、編輯、維護工作流程。在啟動工作流后,還會有一個Q Agent持續對其進行監控,確保能夠自動調整并及時修復。以往完成這些工作可能需要花費數周或數月,而現在僅需幾分鐘。

結語:從服務、工具到基礎設施,全棧升級為生成式AI創造價值托舉

正如計算機科學先驅Alan Kay曾經說過的,最好的軟件工程師自己會構建硬件。新的云計算、生成式AI浪潮會推動在底層的持續創新,底層創新反之又會加速數據及AI的進一步發展。和傳統IT一樣,生成式AI需要計算、網絡、存儲基礎設施的托載,而這些恰恰是亞馬遜云科技長期積累的優勢所在。

將業務和生成式AI結合需要很多工程化能力。在生成式AI發展的早期階段,亞馬遜云科技將其服務重心放在提供“最優組合”上,將技術能力分解為獨立的構建單元(building blocks),以高性價比組件的形式提供給客戶,讓客戶可以按照自己期望的任意組合去嘗試和調整,從而節省開發時間,加速探索生成式AI落地。

總體來看,亞馬遜云科技通過提供豐富的自研及第三方大模型貨架來滿足云客戶差異化需求,通過Amazon Bedrock解決大模型落地效率問題,通過Amazon SageMaker提高資源利用和數據分析的速度,通過Amazon Q讓人人都能簡便快捷地用上生成式AI生產工具,通過底層基礎設施的升級進一步降本增效。

這些投入在為廣泛客戶帶來更大商業回報的同時,也持續鞏固著這家云計算巨頭在生成式AI云服務市場的領導者地位和核心競爭力。