智東西(公眾號:zhidxcom)
作者 | ?ZeR0
編輯 | ?漠影

智東西5月31日報道,5月29日-30日,亞馬遜云科技中國峰會在上海舉行。峰會第二日,亞馬遜云科技大中華區產品總經理陳曉建分享了構建和應用生成式AI的多款創新產品;亞馬遜云科技大中華區解決方案架構總經理代聞以橋梁設計做精巧比喻,從三個方向分享生成式AI時代下架構的演進與迭代。

接入零一萬物、百川智能大模型!云大廠擴張生成式AI版圖,大秀三層技術棧與架構創新

企業開展生成式AI應用落地的過程中面臨新的挑戰,主要體現在:1)底層算力資源短缺;2)缺乏合適的工具,用于訪問和部署世界一流模型,從而進行端到端的生成式AI應用構建;3)缺少匹配自身需求的,可開箱即用快速上手的應用。

為了助力企業生成式AI應用落地,亞馬遜云科技打造三層生成式AI技術棧:

1)底層是以GPU和自研芯片為代表的基礎設施,用于基礎模型的訓練以及在生產環境中運行推理;

2)中間層是以Amazon Bedrock為代表的,提供可以訪問所需基礎模型,以及構建和擴展生成式AI應用程序的工具;

3)頂層則是以Amazon Q為代表的,利用基礎模型構建的開箱即用的生成式AI應用程序,用戶無需任何專業知識即可快速上手生成式AI。

一、技術棧底層:聯手英偉達構建AI超算,上線零一萬物、百川智能基礎模型

亞馬遜云科技大中華區產品總經理陳曉建談道,生成式AI應用開始于基礎模型的訓練和推理,這兩種工作負載對算力有大量需求,也是限制企業模型開發步伐的關鍵制約因素。

為了幫助企業降低經濟壓力,亞馬遜云科技推出了一系列專門構建的、高性價比的芯片和計算實例供企業選擇,用于運行模型的訓練和推理工作負載。

今天的模型規模需要分布式的調度以及相應的存儲和網絡的性能。以訓練500億參數量的模型為例,需要提供1T(1萬億)token的數據量,如果用一張A100的GPU需要74年的時間才能完成,而用2048張GPU則只需要13天。Stability AI訓練Stable Diffusion用了4000張A100 GPU,而Meta訓練Llama 3則使用了超過16000張A100 GPU。

算法工程師通過分布式訓練的技術,同時使用數千張甚至上萬張的GPU卡來訓練基礎模型,需要更好的卡到卡之間,實例到實例之間的高帶寬來降低通信延遲,提高GPU利用率,進而縮短整個集群的訓練時間。

Amazon?UltraCluster提供了超大規模、超高帶寬以及超高穩定的高性能計算集群,FSx for Lustre和S3提供了高性能存儲的穩定方案。

基于英偉達全新GPU資源的系列實例建立在亞馬遜云科技的高性能存儲和網絡服務基礎之上,支持廣泛的編排選項和開源框架,通過EFA網絡,允許企業配置高達2萬個GPU的超級集群來支持最大工作負載。

Project Ceiba項目是亞馬遜云科技為英偉達構建的AI超級計算機,由英偉達和亞馬遜云科技聯合開發,搭載了超過2萬個英偉達Grace架構的Blackwell GB200超級芯片和亞馬遜云科技第四代EFA網絡。每個超級芯片可提供高達800Gbps的網絡帶寬,其算力將能達到驚人的414Exaflops。

接入零一萬物、百川智能大模型!云大廠擴張生成式AI版圖,大秀三層技術棧與架構創新

基于英偉達 A10G GPU的Amazon EC2 G5實例在中國區正式可用,性能達到Amazon EC2?G4DN的3倍,推理性價比提高了40%。

過去5年,亞馬遜云科技在定制芯片領域的投資帶來了機器學習訓練和推理成本的大幅下降。其中,基于Amazon Trainium的Trn1 EC2實例和基于Amazon Inferentia芯片的Inf2 EC2實例,與基于英偉達GPU的Amazon EC2實例相比,可分別將訓練成本降低高達50%,推理成本降低高達40%。

訓練和推理也需要合適的軟件工具。亞馬遜云科技推出了Amazon SageMaker托管機器學習服務,幫助企業輕松構建、訓練、微調和部署模型。

亞馬遜云科技宣布來自零一萬物的Yi-1.5 6B/9B/34B的基礎模型在中國區域正式上線SageMaker Jumpstart,同時來自百川智能的Baichuan-2 7B基礎模型也即將上線中國區域的SageMaker Jumpstart,為開發生成式AI應用提供更多基礎模型選擇。

接入零一萬物、百川智能大模型!云大廠擴張生成式AI版圖,大秀三層技術棧與架構創新

Amazon SageMaker JumpStart是Amazon SageMaker的一項重要服務,可幫助客戶獲取、微調和部署來自業界最新公開的可用預訓練基礎模型,包括Meta Llama 3、Cohere Command等。

該服務還為機器學習從業者提供深度模型定制和評估功能,允許其通過已經使用的環境輕松訪問基礎模型。

此外,Amazon SageMaker HyperPod正式可用,專門助力大規模分布式訓練,能夠將訓練模型的時間減少多達40%。

接入零一萬物、百川智能大模型!云大廠擴張生成式AI版圖,大秀三層技術棧與架構創新

二、技術棧中間層:用基礎模型加速應用構建,四大價值讓生成式AI觸手可及

技術棧的中間層對于大部分企業來說更加重要,構建生成式AI應用通常是從選用既有的基礎模型開始,而不是直接參與構建基礎模型。

所以如何選擇更加適合自身業務的模型,便成為了企業首先需要作答的問題。

在模型選擇方面,Amazon Bedrock是一項全面托管的服務,用戶可通過單一的API訪問來自Al21 Labs、Anthropic、Cohere、Meta、Mistral Al、Stability AI和亞馬遜等領先AI公司的高性能基礎模型。

值得一提的是最新推出的亞馬遜云科技自研Embedding模型Amazon Titan Text Embeddings V2模型,針對檢索增強生成(RAG)工作流程進行了優化。

另一款最新推出的Titan Text Premier基礎模型,是Titan Text系列中先進的型號,旨在為各種企業應用程序提供卓越的性能,并對RAG及Agent提供了專門優化,提供了更高的準確性。

為了幫助企業選擇合適的模型,亞馬遜云科技正式推出了Amazon Bedrock模型評估功能,可將模型評估時間從數個星期壓縮至幾個小時。

在模型定制方面,Amazon Bedrock支持企業自定義模型的導入。企業可將基于Amazon SageMaker或其他工具開發的存儲在Amazon S3里面的定制模型導入到Amazon Bedrock中,以完全托管的API形式進行訪問,而無需管理底層基礎設施。

目前Amazon Bedrock自定義模型導入已提供預覽版,支持Llama、Mistral、Flan-T5三種流行的開放模型架構,同時還將在未來進一步擴展支持范圍。

從數據準備到數據運用,亞馬遜云科技打造了一套全面的數據服務體系,涵蓋數據庫、數據湖、數據治理、數據分析、機器學習和生成式AI五大維度。

該體系可以幫助企業連接現有的數據源,定制面向生成式AI應用構建的高質量企業數據資源,配合Amazon Bedrock提供的微調、持續預訓練、RAG等功能,打造與企業業務相關的生成式AI應用。

為了進一步幫助企業使用RAG技術優化模型的個性化響應,亞馬遜云科技正式推出了 完全托管的Amazon Bedrock知識庫功能。

該功能支持企業使用上下文相關的內部數據自定義基礎模型響應。Amazon Bedrock上的知識庫會自動執行端到端的RAG工作流程,使用者無需編寫自定義代碼來集成數據源和管理查詢。

在應用集成方面,Amazon Bedrock的Agent功能提供了一種工具,支持開發人員定義特定的任務、工作流程或決策過程,增強控制和自動化,同時確保與預期用例保持一致。

Agents for Amazon Bedrock現已支持Claude 3 Sonnet和Haiku模型。

接入零一萬物、百川智能大模型!云大廠擴張生成式AI版圖,大秀三層技術棧與架構創新

亞馬遜云科技還提供了一站式生成式AI應用開發工作站Amazon Bedrock Studio。借助這一工作站,開發者可以使用簡單易用的交互界面進行模型選擇、模型評估,還可以與團隊成員協作,共同試驗,創建和完善生成式AI應用。

接入零一萬物、百川智能大模型!云大廠擴張生成式AI版圖,大秀三層技術棧與架構創新

在負責任的AI方面,亞馬遜云科技承諾以負責任的方式構建服務,同時重點考慮公正性、隱私性和安全性、可解釋性、可治理性、穩健性、透明性6大方面。

企業在構建生成式AI應用程序時,通常希望其客戶和應用之間的交互是安全并遵守企業指導方針的。對此,亞馬遜云科技推出了Amazon Bedrock的Guardrails功能,可幫助企業輕松實施生成式AI應用程序的保護措施,并根據自身需求和負責任AI政策進行定制。

同Amazon Bedrock上基礎模型原生提供的保護能力相比,Amazon Bedrock的Guardrails功能可幫助企業用戶阻止多達85%的有害內容。

三、技術棧上層:開箱即用的生成式AI應用

亞馬遜云科技構建的生成式AI助手Amazon Q可幫助企業達成加速軟件開發、發揮業務數據價值等目標。

接入零一萬物、百川智能大模型!云大廠擴張生成式AI版圖,大秀三層技術棧與架構創新

目前,Amazon Q Developer、Amazon Q Business、Amazon Q in Connect、Amazon Q in QuickSight均已正式可用。

Amazon Q Developer可協助開發人員完成從編碼、測試、升級應用到故障排查、安全掃描和修復、優化云資源等繁瑣重復的工作,讓開發者把更多時間專注于創新體驗的開發,加快應用部署速度。

在實際應用中,Amazon Q Developer共包含3大核心應用場景:1)大規模消除技術冗余;2)提高開發人員生產力;3)近乎實時生成代碼建議和推薦,幫助開發人員更快、更安全地進行構建。

為了幫助企業發揮大量難以訪問和解析的數據的價值,亞馬遜云科技推出了具有從任意數據中獲取洞見能力的Amazon Q Business。

接入零一萬物、百川智能大模型!云大廠擴張生成式AI版圖,大秀三層技術棧與架構創新

通過它,企業員工可以通過連接企業數據庫,來提問關于公司政策、產品信息、業務結果、代碼庫、人員等諸多問題,從而總結數據邏輯、分析趨勢并就數據進行對話。

Amazon Q Business有四大應用場景:統一的對話檢索式體驗、生成總結與提煉關鍵發現、提升內容創作的效率、簡化任務流程。

Amazon Q Business中的Amazon Q Apps功能公開預覽。借此創建應用程序非常簡單,員工可以用自然語言描述他們想要的應用程序類型,或者只需告訴Amazon Q Apps從Amazon Q幫助解決問題的對話中執行即可。

接入零一萬物、百川智能大模型!云大廠擴張生成式AI版圖,大秀三層技術棧與架構創新

Amazon Q Developer 和 Amazon Q Business截止到6月30號免費試用。

四、亞馬遜云科技全方位助力人才成長,三大力量驅動架構創新

亞馬遜云科技計劃到2025年向全球2900萬人提供免費培訓,而目前已經有2100萬人受益。

為了讓更多的開發者有機會低門檻體驗到前沿的生成式AI服務,亞馬遜云科技推出了云上探索實驗室CloudLab平臺。開發者不需要注冊賬號、不需要購買云資源,只需掃碼進入云上探索實驗室,即可在24小時之內盡情構建。

同時,亞馬遜云科技還為中國開發者量身定做了“從基礎到應用:LLM 全景培訓”課程。

接入零一萬物、百川智能大模型!云大廠擴張生成式AI版圖,大秀三層技術棧與架構創新

生成式AI時代,構建應用有什么不一樣的方法?有何種新的架構趨勢?

亞馬遜云科技大中華區解決方案架構總經理代聞說,技術架構演進過程里面不變的三個主題需求——基礎組件能力,架構體系創新,多元技術融合。

代聞從橋梁發展歷程入手,提出橋梁的發展和構建是由基礎材料,建筑架構和多元化需求三者共同作用的結果,而技術的發展往往也是如此。

最基礎的組件,例如材料、技術往往決定了能采用的架構。對于信息技術來說,最基礎的材料就是算力。

云計算的最基礎組件是計算、存儲和網絡,其中又以計算作為最核心的組件。

自2006年推出Amazon EC2服務以來,Amazon EC2從最初的70種實例類型增長到超過750種,亞馬遜云科技在虛擬化技術和硬件加速方面正持續進步。

亞馬遜云科技已發布五代Nitro芯片。Nitro提供了一個隔離的敏感數據處理環境Nitro Enclaves,可以為客戶自己的實例帶來額外的隔離,保護正在使用的數據免受任何未經授權的訪問,即使是來自客戶管理員級別的用戶。

接入零一萬物、百川智能大模型!云大廠擴張生成式AI版圖,大秀三層技術棧與架構創新

在自研處理器方面,從2018年的Amazon Graviton到2023年的Amazon Graviton4,每一代的Graviton都會上一代有兩位數的性能提升,并且單位算力的功耗在不斷下降。

亞馬遜云科技在全球規模化提供的基于Graviton的Amazon EC2實例種類達150多個,已經構建的Graviton處理器數量超過200萬個,并擁有超過50000客戶。

接入零一萬物、百川智能大模型!云大廠擴張生成式AI版圖,大秀三層技術棧與架構創新

如今亞馬遜云科技的諸多托管服務都全面采用了Graviton架構,如Amazon DocumentDB、Amazon Aurora、Amazon RDS等,這些服務不僅提高了性能,還降低了成本,為客戶提供了更高的性價比。

代聞認為,構建的風險管理意識非常重要,企業在構建時往往要面臨著大量的不確定性,各種風險因素層出不窮,因此架構韌性成為了重中之重。

通過單元化架構,亞馬遜云科技將IAM拆分成細小的計算和存儲單元,實現了高可用性和極小的故障影響范圍,不僅保障了服務的穩定性,也使得IAM能夠每秒處理超過10億個API調用。

接入零一萬物、百川智能大模型!云大廠擴張生成式AI版圖,大秀三層技術棧與架構創新

架構創新的第三大驅動力量是多元技術融合。

通過Zero-ETL集成,亞馬遜云科技消除了數據提取、轉換和加載的復雜性,使得用戶可以無縫地將數據從Amazon DocumentDB同步到Amazon OpenSearch Service,或者將 Amazon DynamoDB的數據直接用于Amazon Redshift的分析。這種無縫集成不僅簡化了數據流動,也提高了數據的價值和業務的敏捷性。

接入零一萬物、百川智能大模型!云大廠擴張生成式AI版圖,大秀三層技術棧與架構創新

結語:推動服務和架構創新,助力生成式AI普惠化

過去十年,云計算為創新和創業提供了前所未有的便利。未來十年,生成式AI帶來了重塑各行各業的新機遇。

整體應用架構是多元技術均衡的結果,需要考慮成本、合規、擴展性、可持續發展、韌性、安全、性能、訪問可達性、可用性等因素。一個良好的架構需能隨著多元因素的影響不斷演進。

亞馬遜云科技的優良架構體系到現在已經超過十年,從卓越運營、安全、可靠、性能效率四個維度演進到六個維度,新增了可持續發展和成本優化。隨著客戶對各種組件更深入的使用,架構師的決定和組件選擇會直接影響到整塊的應用負載在云上的成本。

伴隨著技術的進步,亞馬遜云科技將繼續推動架構的演進,通過創新的服務和架構,突破技術壁壘,助力生成式AI普惠化。