智東西(公眾號:zhidxcom)
作者 | ZeR0
編輯 | 漠影

智東西11月29日拉斯維加斯報道,北京時間11月30日,在年度“云計算春晚”AWS re:Invent大會舉行的第三天,AWS數據與AI副總裁Swami Sivasubramanian發表主題演講,公布AWS幫助客戶構建生成式AI應用的一系列工具與技術。

除了在Amazon Bedrock平臺發布更多第三方和自研基礎模型、語言模型外,Sivasubramanian還分享了AWS幫助客戶負責任且更加輕松地構建、訓練和部署生成式AI模型的多項創新措施。

AWS發布圖像生成模型!5項SageMaker新功能炸場,讓構建生成式AI應用更輕松安全

一、提供更多第三方大模型,自研多模態基礎模型上新

Sivasubramanian說,構建生成式AI應用離不開4個要素:基礎模型、利用數據的隱私環境、易用的工具、特制的機器學習基礎設施

AWS發布圖像生成模型!5項SageMaker新功能炸場,讓構建生成式AI應用更輕松安全

他將Amazon Bedrock平臺稱作是“在基礎模型和大語言模型上構建和擴展生成式AI應用的最簡單方式”,提供包括第三方模型和自研模型在內的廣泛模型選擇。超過10000個客戶正在使用Amazon Bedrock。

AWS發布圖像生成模型!5項SageMaker新功能炸場,讓構建生成式AI應用更輕松安全

1、提供更多第三方大模型

在上述基礎上,AWS宣布明星AI安全獨角獸企業Anthropic的Claude 2.1、科技巨頭Meta的Llama 2 70B等大語言模型均已在Amazon Bedrock上推出。

AWS發布圖像生成模型!5項SageMaker新功能炸場,讓構建生成式AI應用更輕松安全

2、推出Amazon Titan多模態嵌入

向量是定制生成式AI應用的關鍵。下圖是不使用與使用向量嵌入的搜索結果對比,向量嵌入有助于提高搜索結果準確性。

AWS發布圖像生成模型!5項SageMaker新功能炸場,讓構建生成式AI應用更輕松安全

多種模型混合增加了搜索方式的復雜性,會影響客戶體驗。為此,AWS推出Amazon Titan多模態嵌入,幫助客戶為最終用戶提供更準確且與上下文相關的搜索和推薦體驗。

AWS發布圖像生成模型!5項SageMaker新功能炸場,讓構建生成式AI應用更輕松安全

“多模態”是指模型可以為圖像和文本生成嵌入,并將其存儲在客戶的矢量數據庫中,最終用戶可以使用文本、圖像或圖文混合提交搜索查詢。

該模型將多達128個標記的圖像和短英文文本轉換為嵌入,從而捕獲數據之間的語義和關系;默認情況下會生成1024維的向量。

3、Amazon Titan文本嵌入上新

Amazon Titan文本嵌入可將文本翻譯成數值表示,支持語義搜索、文本注釋和聚類,支持超過25種語言。

Amazon Titan Text Lite和Amazon Titan Text Express兩款大語言模型均已可用,支持總結、翻譯、對話、代碼生成等豐富的文本相關任務,能夠幫助優化準確性、性能與成本。

AWS發布圖像生成模型!5項SageMaker新功能炸場,讓構建生成式AI應用更輕松安全

其中Lite高度可定制,性價比高,最大上下文長度為4096個token,非常適合英語任務,可以對文章總結、寫文案等任務進行微調。

Express使用范圍更廣泛,最大上下文長度為8192個token,適合開放式文本生成、對話聊天等任務,并支持檢索增強生成(RAG)工作流。

4、推出Amazon Titan圖像生成模型預覽版

在圖像生成方向,AWS推出Amazon Titan圖像生成模型預覽版。用戶輸入文字,就能實現擴展或更換背景、調整主體方向、改變圖像尺寸等圖像編輯要求。

AWS發布圖像生成模型!5項SageMaker新功能炸場,讓構建生成式AI應用更輕松安全

該模型由高質量、多樣化的數據訓練而成,可以理解復雜的提示詞,創建更準確的輸出,例如具有包容性屬性和有限失真的逼真圖像。企業還可以用專有數據來定制模型。

Sivasubramanian強調說,Titan圖像生成模型支持負責任的AI使用,其生成的所有圖像都包含一個不可見的水印,通過提供一種謹慎的機制來識別AI生成的圖像,幫助減少錯誤信息傳播。

二、三大功能讓基礎模型定制更安全準確

“數據是生成式AI應用的差異所在。”

Sivasubramanian分享道,Amazon Bedrock支持用私有數據安全地定制基礎模型,該平臺提供的定制Amazon Titan模型新功能包括微調、持續預訓練、RAG

借助微調,企業可以通過提供自己的特定標注訓練數據集來提高模型準確性。Amazon Bedrock支持對Meta Llama 2、Cohere Command Light等第三方模型和AWS自研模型Amazon Titan進行微調。

AWS發布圖像生成模型!5項SageMaker新功能炸場,讓構建生成式AI應用更輕松安全

持續預訓練可以幫助模型在原始訓練之外,通過積累更多的健壯知識和適應性,變得更加特定于領域。通過持續預訓練,企業可以在具有客戶管理密鑰的安全托管環境中使用自己的未標注數據來訓練模型。

持續預訓練可用于Amazon Titan Text模型的公開預覽版,包括Titan Text Express和Titan Text Lite。預訓練完成后,用戶可以收到唯一的模型ID,定制模型將由Amazon Bedrock再次存儲。

Amazon Bedrock知識庫已全面開放。通過知識庫,企業可以安全地將Amazon Bedrock中的基礎模型與自有數據連接起來,以用于檢索增強生成,訪問附加數據以生成更相關、更具體和更準確的響應,而無需不斷重新訓練基礎模型。

AWS發布圖像生成模型!5項SageMaker新功能炸場,讓構建生成式AI應用更輕松安全

該知識庫可管理初始向量存儲設置,處理嵌入和查詢,并提供生產檢索增強生成應用程序所需的源屬性和短期內存。企業還可以定制檢索增強生成工作流以滿足特定的用例需求,或者將檢索增強生成與其他生成式AI工具及應用程序集成。

Amazon Bedrock提供了豐富的向量數據庫。

AWS發布圖像生成模型!5項SageMaker新功能炸場,讓構建生成式AI應用更輕松安全

三、Agents for Amazon Bedrock全面可用,自動編排完成復雜任務

Agents for Amazon Bedrock通過使用基礎模型的推理能力,將用戶請求的任務分解為多個步驟,創建編排計劃,然后調用公司API和使用檢索增強生成訪問知識庫來執行該計劃,幫助用戶加速生成式AI應用開發。

借助Agents for Amazon Bedrock,用戶輕點幾下,就能讓生成式AI應用完成復雜任務。

其對編排的改進控制功能變得更強,對思維推理鏈也具有更好的可見性。開發人員使用跟蹤功能可以來跟蹤執行計劃時使用的推理,查看業務流程中的中間步驟,并據此對問題進行故障排除;還可以訪問和修改agent自動創建的提示詞,進一步增強終端用戶體驗。

AWS發布圖像生成模型!5項SageMaker新功能炸場,讓構建生成式AI應用更輕松安全

Agents在專注于特定任務時表現更好,指令越清晰、可用的API越集中,基礎模型就越容易推理并確定正確的步驟。

AWS生成式AI創新中心收到很好的反饋,即將支持定制Anthropic Claude模型的計劃。

AWS發布圖像生成模型!5項SageMaker新功能炸場,讓構建生成式AI應用更輕松安全

四、5項Amazon SageMaker新功能:讓構建與部署生成式AI模型更輕松

從收集數據、創建聚類(clusters)、分布模型訓練、checkpoint模型到修復硬件問題,訓練基礎模型的過程充滿挑戰。對此,Amazon SageMaker機器學習平臺提供了覆蓋推理、創新和MLOps的一系列創新功能。

AWS發布圖像生成模型!5項SageMaker新功能炸場,讓構建生成式AI應用更輕松安全

Sivasubramanian宣布了全托管服務Amazon SageMaker的5項新功能,讓客戶能夠更輕松地構建、訓練和部署生成式AI模型。

1)SageMaker HyperPod:自動在數百或數千個加速器之間分配訓練工作負載,幫助客戶將模型訓練時間縮短多達40%。

AWS發布圖像生成模型!5項SageMaker新功能炸場,讓構建生成式AI應用更輕松安全

2)SageMaker Inference:支持客戶將多個模型部署到同一個AWS實例,更好地利用底層加速器并降低部署成本和延遲。

3)SageMaker Clarify:幫助客戶評估、比較、選擇適合其特定用例的最佳模型,根據選擇的參數來支持負責任地使用AI。

4)兩項SageMaker Canvas增強功能:無需編寫任何代碼即可構建自定義模型,讓客戶能夠更輕松、更快地將生成式AI集成到工作流程中。

五、提供數據基礎全套服務,向量搜索為生成式AI準確性護航

Sivasubramanian說,強大的數據基礎是生成式AI的關鍵。AWS提供了數據基礎的全套服務。

AWS發布圖像生成模型!5項SageMaker新功能炸場,讓構建生成式AI應用更輕松安全

向量搜索是機器學習領域的一種新興技術,通過使用距離或相似性度量比較向量表示,來找到與給定數據相似的數據點。這種方法能實現精確的信息檢索,對構建生成式AI應用非常有用。

Amazon Aurora PostgreSQL、Amazon RDS for PostgreSQL、Amazon OpenSearch Service、Amazon OpenSearch Serverless等服務均提供向量搜索能力。

AWS最新正式發布的Amazon OpenSearch Serverless向量引擎是一種簡單、可擴展且高性能的相似度搜索功能。

AWS發布圖像生成模型!5項SageMaker新功能炸場,讓構建生成式AI應用更輕松安全

向量引擎支持通過在同一查詢中組合向量搜索和全文搜索,來優化和調整混合搜索的結果,讓用戶無需管理底層向量數據庫基礎設施,即可輕松構建機器學習增強搜索體驗和生成式AI應用程序,幾毫秒可存儲、更新和搜索數十億個有數千個維度的向量嵌入。

AWS還宣布Amazon DocumentDB和DynamoDB內置的向量搜索功能全面可用,支持用戶在文檔數據庫中以毫秒級響應時間存儲、索引和搜索數百萬個向量,并推出Amazon MemoryDB for Redis向量搜索功能的預覽版。

AWS發布圖像生成模型!5項SageMaker新功能炸場,讓構建生成式AI應用更輕松安全

分析數據庫引擎Amazon Neptune Analytics也正式發布,更易發現圖形與向量之間的關系,還可以使用它增強基礎模型的提示,讓圖形數據分析更高效簡便。初步基準測試標明,Neptune Analytics從Amazon S3加載數據的速度比現有的AWS解決方案快80倍。

AWS發布圖像生成模型!5項SageMaker新功能炸場,讓構建生成式AI應用更輕松安全

AWS還推出了Amazon OpenSearch Service zero-ETL與Amazon S3集成的預覽版,使客戶能夠直接查詢其運營數據,降低復制數據或管理多個分析工具的操作復雜性,避免過多重復管理,減少了成本和操作時間。

AWS發布圖像生成模型!5項SageMaker新功能炸場,讓構建生成式AI應用更輕松安全

此外,AWS發布了由生成式AI支持的Amazon DataZone自動化功能預覽版。

該功能由Amazon Bedrock的大語言模型提供支持,可以使傳統勞動密集型數據編目過程自動化,生成數據資產及其模式的詳細描述,并建議分析用例,從而大大減少為組織數據提供上下文所需的時間,讓數據編目和發現進一步簡化。

為了幫助客戶和合作伙伴在不共享原始數據的情況下應用機器學習模型,AWS推出AWS Clean Rooms ML預覽版。該功能可幫助企業及其合作伙伴在無需相互復制或共享原始數據的情況下共同訓練模型,多則可節約數月時間。

AWS發布圖像生成模型!5項SageMaker新功能炸場,讓構建生成式AI應用更輕松安全

六、用AI優化數據管理,給開發人員持續減負增效

AI為優化數據基礎提供了更多燃料,使得數據管理更容易、更好用、更直觀、更易訪問。

AWS昨日發布的生成式AI助手Amazon Q能夠支持開發者全生命周期,根據企業業務進行定制,通過連接到企業的信息庫、代碼、數據和企業系統,向開發人員和IT專業人員提供對話問答、優化Amazon EC2實例選擇、直接在控制臺中排除和解決錯誤、網絡故障排除協助等功能,使其無論是構建應用程序、研究最佳實踐、編程還是解決問題,都能快速訪問答案并獲得想法上的幫助。

AWS發布圖像生成模型!5項SageMaker新功能炸場,讓構建生成式AI應用更輕松安全

啟用AI驅動擴展和優化的Amazon Redshift Serverless,會根據查詢復雜性、頻率、數據集大小等維度主動和自動擴展容量,提供平衡價格與性能的優化。

Amazon? Redshift查詢編輯器中的Amazon Q生成式SQL預覽版可根據自然語言提示生成SQL建議,讓編寫有效的SQL查詢更高效。數據庫管理員還可以授權模型使用AWS帳戶中所有用戶的查詢歷史記錄來生成更相關的SQL語句。

AWS Glue數據質量功能預覽版即將發布,用機器學習來檢測統計異常情況,幫助提高數據質量,無需寫代碼即可深入了解數據質量問題、數據質量評分、可用于持續監視異常的規則建議。

AWS發布圖像生成模型!5項SageMaker新功能炸場,讓構建生成式AI應用更輕松安全

業務用戶經常需要分享其數據發現。對此,AWS推出QuickSight的Amazon Q預覽版。它可以幫助業務用戶創建格式優美的敘述來描述數據,在QuickSight中輕松與他人共享文檔、幻燈片格式的視覺效果、圖像與文本,還可以幫助理解儀表板上的關鍵亮點、提供數據問答服務。

AWS發布圖像生成模型!5項SageMaker新功能炸場,讓構建生成式AI應用更輕松安全

結語:生成式AI仍處于早期階段,負責任的AI日益受關注

在Sivasubramanian看來,生成式AI仍處于早期階段,依賴于干凈的數據和人工輸入才能取得成功。數據、生成式AI和人類三者相輔相成,共同為客戶提供創新和更好的體驗。

比如Amazon Bedrock創建應用程序,用戶輸入自然語言就能收集完成項目的詳細步驟、材料、工具和建議的列表,Code Whisperer提供了AI驅動的編程建議,Amazon Q通過扮演AWS及商業專家角色來加速生產力。

AWS發布圖像生成模型!5項SageMaker新功能炸場,讓構建生成式AI應用更輕松安全

由AWS委托、Morning Consult對美國商業領袖代表性樣本進行的一項新調查顯示,隨著越來越多的公司和組織將生成式AI應用于其業務,負責任的AI變得越來越重要。77%的受訪者表示他們熟悉負責任的AI,47%的受訪者計劃在2024年對負責任的AI進行比2023年更多的投資。

最后,針對在開發所有階段都至關重要的模型評估,AWS推出Amazon Bedrock模型評估預覽版,為開發人員提供用于構建生成式AI應用程序的評估工具,使其能夠評估、比較和選擇適用于自家用例的最佳基礎模型。

AWS發布圖像生成模型!5項SageMaker新功能炸場,讓構建生成式AI應用更輕松安全