2024年已行進尾聲,但對于生成式AI而言,這又是波瀾壯闊的一年。

Sora掀起視頻生成熱潮,多模態世界模型的研究熱度漸起。更具革命性的推理模型o1悄然出世,帶來的思維鏈CoT+強化學習這一新范式,正推動生成式AI邁入新的階段。

基座大語言模型不再持續狂飆,不僅價格戰、營銷戰硝煙燃起,融資熱度降溫,Scaling Law是否撞墻更是在年底引發熱議。不過行業賦能持續進行,包括智能體在內的應用層的興起仍然備受期待。同時,大模型向邊端下沉的趨勢日趨明顯,AI手機、AI PC等AI硬件紛紛站上風口。

GPT-4o的出現,將輕量化模型和端側大模型推向新高度之余,端側設備的交互革新也有了前進方向。不止AI硬件,大模型驅動下的具身智能更是熱度空前,人形機器人正開啟星辰大海。

而作為支撐大模型運行以及生成式AI應用開發的關鍵,AI Infra也走到了臺前,從智算集群到基礎軟件,發展勢頭強勁,但挑戰不少。

在上述背景下,2024中國生成式AI大會(上海站)「GenAICon 2024」將于12月5-6日上海中星鉑爾曼大酒店盛大舉辦。中國生成式AI大會已成功舉辦兩屆,迅速成長為國內生成式AI領域最具影響力的產業峰會之一。

此次也是中國生成式AI大會首次登陸上海舉辦。大會由智一科技旗下智能產業第一媒體智東西、AI與硬科技知識分享社區智猩猩共同發起主辦。上海市人工智能行業協會為大會的指導單位。

大會上海站以“智能躍進 創造無限”為主題,50+位嘉賓將帶來致辭、演講、報告和對話討論,基于前瞻性視角解構和把脈生成式AI的技術產品創新、商業落地解法、未來趨勢走向與前沿研究焦點。

上海站由“主會場峰會+分會場研討會+展覽區”組成。主會場將進行大模型峰會、AI Infra峰會,分會場將進行端側生成式AI技術研討會、AI視頻生成技術研討會和具身智能技術研討會。展覽區則緊鄰會場門口設置,14家企業將進行技術產品展示。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

大會主會場將進行「大模型峰會」和「AI Infra峰會」。主會場邀請到30+位來自學術界和工業界的知名學者、公司創始人及技術決策者參加,他們將以主題演講、高端對話、圓桌討論等不同形式,分享在大模型和AI Infra上的技術突破、產品創新、應用實踐和前沿探索。

今天為大家正式揭曉主會場峰會的完整議程。

一、主會場峰會完整議程

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

二、大模型峰會演講介紹

大模型峰會將于12月5日進行,將由上海市人工智能行業協會黨支部書記、副秘書長徐琦進行大會致辭,智一科技聯合創始人、CEO龔倫常代表主辦方致辭。復旦大學計算機科學技術學院教授、上海市智能信息處理實驗室副主任張奇將以《大語言模型的能力邊界與發展思考》為主題,帶來開場報告。

MiniMax副總裁劉華,銀河通用機器人合伙人、大模型負責人、北京智源人工智能研究院具身智能PI張直政,北京大學(臨港)大模型對齊中心執行主任、北京阿萊門科技有限公司首席執行官徐驊,西湖大學助理教授張馳將圍繞多模態大模型開放平臺、具身智能、多模態對齊、通用圖像單目深度估計大模型在上午帶來主題演講。

同時,大模型峰會上午場將進行高端對話,由智一科技聯合創始人、智車芯產媒矩陣總編輯張國仁主持,華映資本海外合伙人邱諄、BV百度風投執行董事溫永騰、達晨財智晨云子基金合伙人朱翔參與共同探討《大模型時代,資本市場的新風向》。

在大模型峰會下午場,聯匯科技CEO兼首席科學家趙天成,VAST CTO梁鼎,騰訊優圖實驗室天衍研究中心負責人、專家研究員吳賢,西湖心辰CEO、西湖大學深度學習實驗室成果轉化負責人醒辰,RockAI CTO楊華,趣丸科技副總裁賈朔,螞蟻集團資深算法專家李龍飛,WeMeet 薈神創始人顧學斌,華院計算大模型和知識推理算法負責人蔡華9位大咖將參與,深入分享他們在3D生成、醫學、情感、音樂生成、金融、法律等不同領域的大模型探索和應用實踐。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

演講嘉賓:復旦大學計算機科學技術學院教授、上海市智能信息處理重點實驗室副主任 張奇

演講主題:《大語言模型的能力邊界與發展思考》

內容概要:2023年大型語言模型迎來了迅猛的發展,在自然語言處理、智能問答、文本創作等多個領域展現出了前所未有的能力。這一系列令人矚目的成果,使得各界對于通用人工智能(AGI)的實現滿懷憧憬與期待,甚至有不少樂觀的預測認為,基于大模型構建的通用人工智能在短時間內便會成為觸手可及的現實。然而,在這一片樂觀的喧囂背后,我們更需冷靜思考:大語言模型那令人驚嘆的能力究竟源自何處?其能力的拓展是否存在著無法逾越的邊界?大語言模型未來又將沿著怎樣的路徑持續演進與發展?本次介紹就將圍繞上述這些問題展開初步的深入探討,以期拋磚引玉,讓大家對大語言模型有更為透徹與清晰的認知。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

演講嘉賓:MiniMax副總裁 劉華

演講主題:《多模態大模型開放平臺探索與實踐》

內容概要:多模態大模型正在重新定義人工智能的應用邊界。通過整合文本、圖像、音頻、視頻等多種形式的數據,多模態大模型在許多領域展現了強大的理解和生成能力。隨著模型能力的不斷提升,多模態大模型不僅正在助力形成新質生產力,還在多個行業場景中展現出巨大的潛力。

此次演講MiniMax將分享如何在多模態大模型研發中不斷創新,并實現大模型技術的快速落地。通過不同的實際案例,MiniMax將向大家展示如何利用多模態大模型技術解決不同行業場景的復雜問題。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

演講嘉賓:銀河通用機器人合伙人、大模型負責人,北京智源人工智能研究院具身智能 PI 張直政

演講主題:《具身智能從“專”到“通”之路》

內容概要:機器人從“專用”到“通用”的發展是具身智能的使命,而大模型技術是推動這一發展的關鍵。本報告將首先從數據、模型、系統的角度介紹對于具身智能的Scaling Law探索,并介紹這一探索的重大意義。其次,報告將深入剖析機器人從“專用抓取”到“通用抓取”,從“通用抓取”到“通用操作”,再到面向終局的端到端具身大模型的科研思路和最新成果。最后,報告將討論這一系列前沿探索在相關產業中形成新質生產力的諸多機會和可能性。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

高端對話嘉賓:華映資本海外合伙人 邱諄

邱諄,現任華映資本海外合伙人,加入華映前歷任德迅、云九、復星、弘毅等雙幣VC合伙人;硅谷工作20多年,歷任Cisco、Brocade硅谷總部技術高管,騰訊云計算早期T4專家架構師兼技術總監;北京大學計算機本科,美國南加州大學USC人工智能多Agent博士方向,機器人世界杯RoboCup冠軍隊成員,擁有多項專利和AI頂會論文。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

高端對話嘉賓:BV百度風投執行董事 溫永騰

溫永騰先生現負責BV百度風投人工智能應用賽道,關注生成式AI技術及應用的投資機會。他從事科技領域投資多年,曾主導投資了西湖心辰、生數科技、詩云科技、云舶科技、數字力場、粒界科技等科技公司。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

高端對話嘉賓:達晨財智晨云子基金合伙人 朱翔

朱翔,達晨財智晨云子基金合伙人,同濟大學軟件工程碩士,中歐商學院MBA ,主要覆蓋AI和具身智能方向。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

演講嘉賓:北京大學(臨港)大模型對齊中心執行主任、北京阿萊門科技有限公司首席執行官 徐驊

演講主題:《破解大模型安全與實用性矛盾:多模態對齊的探索與實踐》

內容概要:本次演講將首先介紹當前大模型面臨著兩難境地,過于安全可能致其無用,而安全性不足則可能引發隱患,亟需找到安全與實用的動態平衡。之后,將重點介紹北大研究團隊探索的對齊技術的多樣化框架。包括基于人類反饋的強化學習RLHF;針對復雜場景的靈活對齊工Aligner;多模態對齊技術,實現語言、圖像、視頻等信息的高效融合;以及Inference Time對齊實現推理階段實時調整輸出。接著會分享多模態對齊技術的實踐案例,多模態對齊目前已應用于醫療影像分析和處方檢查,RLHF+Aligner能夠提升法律問答準確性,多模態對齊助力具身智能領域的智能駕駛座艙和機器人交互。在未來,我們致力于推動從研究到產業的深度融合,推動RLHF與Aligner技術在更多領域的縱深應用,構建面向嚴肅場景的高效推理對齊框架,支持實時響應和個性化調整。使對齊技術驅動生成式AI在醫療、教育、法律等領域的行業變革,促進生成式AI在社會中的可信落地。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

演講嘉賓:西湖大學助理教授 張馳

演講主題:《通用圖像單目深度估計大模型》

內容概要:單目深度估計旨在從單張圖像中預測場景的深度信息。與雙目深度估計相比,單目深度估計具有更高的應用靈活性,但也面臨缺乏三維信息導致的復雜性和不確定性問題。近年來,單目深度估計在自動駕駛、機器人導航和生成式人工智能等領域獲得了廣泛關注。最近的研究趨勢集中于全場景通用的單目深度估計大模型的開發。傳統的深度估計模型通常針對特定場景進行訓練,難以在多樣化的場景中取得理想的性能。而全場景通用的單目深度估計大模型旨在實現一個能夠適配多種復雜場景的模型,顯著提升其通用性和魯棒性。為了實現這一目標,研究者們在過去兩年中在多個方面取得了重要進展。本次報告將討論幾個學界重點關注的研究方向,包括如何利用海量無標注或弱標注數據來增強模型的泛化能力,如何設計更有效的監督訓練范式和損失函數,以及如何更好地利用大模型的先驗知識來提升深度估計的精度和穩定性。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

演講嘉賓:聯匯科技 CEO兼首席科學家 趙天成

演講主題:《以智能體為中心的AI原生應用和開源生態》

內容概要:智能體作為應用前沿,正在重塑技術與場景之間的互動方式。本次演講以智能體的開發與應用為核心,重點介紹Om Agent平臺在AI原生應用中的實踐,包括如何快速構建、部署和管理AI原生應用,讓每個智能硬件設備具備人類認知級別的智能體,快速適應、賦能各種場景,以及在不同行業與領域的原生應用案例。同時,強調構建開源生態也是推動智能體應用創新的重要依托,更多開發者的加入與應用的產生將能夠服務更廣泛的用戶,讓每個人都能真正地享受到技術創新成果。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

演講嘉賓:VAST CTO 梁鼎

演講主題:《大模型加持,3D AIGC的發展與應用》

內容概要:我們生活在三維世界中,但由于創作成本高昂,很難像拍照或錄視頻一樣輕松創作3D內容。隨著3D AIGC技術的不斷發展,這種局面正在逐漸改變。

本報告將聚焦3D AIGC技術,詳細解析其在大模型生成浪潮中的進展和最新成果,并探討技術推動下的多領域應用實踐,為未來3D創作的普及提供新思路。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

演講嘉賓:騰訊優圖實驗室天衍研究中心負責人、專家研究員 吳賢

演講主題:《從深度學習到大模型,醫學AI上的一些嘗試》

內容概要:在醫學領域,幾乎所有的通用 NLP 任務都可以找到相應的實際應用場景,例如醫患對話、醫學信息提取、疾病診斷、藥物推薦以及報告生成等。目前,已有大量的研究將 LLM應用于醫學領域,部分大型模型甚至已經高分通過了醫師資格考試。然而,仍有許多問題需要進一步研究。本次分享旨在深度探索大模型技術在醫學領域的研究和應用問題,包括訓練效率問題,包括幻覺問題,包含在臨床場景中實際遇到的問題等。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

演講嘉賓:西湖心辰CEO、西湖大學深度學習實驗室成果轉化負責人 醒辰

演講主題:《讓AI懂人心,說人話——多模態情感大模型的應用探索》

內容概要:語言、文字的發明都是為了溝通和交流,在AI技術高速發展的今天,人機交流的種種矛盾也被放到臺前。“AI不明白我的意思”,“AI理解不了我的心情”大眾對此很有共鳴,也是一定程度上排斥AI的原因。AI的智商雖然關鍵,情商更為重要,它是AI與人類和諧共存的基石。

怎么讓AI模型懂人心?說人話?西湖心辰自創立以來一直深耕打造“高情商”“超擬人”的AI模型,并且持續探索其應用邊界,以期為公眾帶來福祉并創造社會價值。

在本次演講中,將重點介紹我們的模型能力在心理領域的落地應用,包括端到端多模態識別與交互、長程對話能力以及情感感知等關鍵能力。用實際案例證明AI模型不論是基于文字還是語音都能懂人心、說人話,共同探討AI在個性化心理健康服務領域的未來發展。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

演講嘉賓:RockAI CTO 楊華

演講主題:《非Transformer架構大模型Yan在端側的實踐》

內容概要:本次演講將探討生成式AI在端側面臨的挑戰,詳解國內首個非Transformer架構大模型Yan的技術路線及其落地應用,還將分享大模型從單體智能到群體智能的發展路徑。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

演講嘉賓:趣丸科技副總裁 賈朔

演講主題:《讓每個人體驗音樂創作——音樂生成大模型的創新實踐》

內容概要:隨著AIGC技術的成熟和廣泛應用,AI和音樂可以碰撞怎樣的火花?如何降低門檻讓普通用戶體驗音樂創作的樂趣?趣丸科技推出了自主研發的全球首個多模態音樂生成大模型——天譜樂AI。該模型集成音頻處理、深度學習及大數據分析等領先技術,不僅支持文生音樂、音頻生音樂,還首創圖片/視頻生音樂功能,生成的歌曲自帶人聲唱詞,效果達到專業發行水準。

本次演講聚焦AI音樂,重點分享趣丸科技自研的音樂生成大模型天譜樂AI的初衷、產品研發、應用實踐和愿景。AI音樂工具不僅是技術的堆砌,更是用戶情感的載體。天譜樂AI通過技術創新降低音樂創作門檻,讓用戶不再受限于專業的樂理知識,復雜的音樂制作流程和昂貴的版權費用,就可以輕松通過音樂創作記錄生活的切片,在創作中提升審美自覺和音樂生產能力。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

演講嘉賓:螞蟻集團資深算法專家 李龍飛

演講主題:《生成式大模型在螞蟻內部的應用和挑戰》

內容概要:生成式語言大模型在近兩年取得了突破性的進展,在螞蟻內部也有大量的業務在應用llm來進行各種各樣的業務改造和創新,并取得了一些結果,例如螞蟻的支小寶,醫療管家等業務。在業務應用LLM的過程中也遇到了一些挑戰,主要集中在可信,以及效率等方面,例如在模型的部署服務過程中,就面臨資源利用率,推理速度等效率相關的問題,在用戶的應用過程中也遇到一些和大模型幻覺相關的挑戰,本次分享會介紹螞蟻在這兩個方面上的一些工作和嘗試。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

演講嘉賓:WeMeet薈神創始人 顧學斌

演講主題:《基于大模型構建多智能體商務互聯平臺的實踐》

內容概要:76秒創建AI商務應用,顧學斌先生將分享WeMeet薈神如何基于大模型構建多智能體商務互聯平臺的實踐和案例,幫助與會者了解如何精準分析AI應用場景的痛點、需求和用戶意圖,進而結合大模型和多智能體的技術進展,構建可滿足用戶和場景中長期需求的平臺。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

演講嘉賓:華院計算大模型和知識推理算法負責人 蔡華

演講主題:《法律大語言模型在社會治理中的落地應用》

內容概要:隨著大語言模型(LLM)在自然語言處理和法律推理中的突破性進展,我們正迎來一個法律科技變革的新時代:法律大語言模型能夠理解、生成和分析法律文本,全面提升法律服務的效率和公平性。如何將法律大語言模型的認知智能應用于社會治理的廣泛領域,從事更多智能化、精準化的法律服務,是法律科技和社會治理研究的重要方向。在此背景下,華院計算實踐出了一套面向法律大語言模型應用的產品架構,以智能法律服務的理念幫助政府和企業解決法律服務效率低、資源不足、應用落地難等現實問題。

在本次分享中,我們將介紹該框架的基礎概念和原理,并通過具體案例展示法律大語言模型在法律咨詢、案件分析和智能審判等任務中的應用。此外,我們還將介紹法律大語言模型的訓練方法、推理機制以及在不同法律場景中的實際應用效果,通過這些實踐案例展示法律大語言模型如何實現社會治理的智能化和高效化。

三、AI Infra峰會演講介紹

AI Infra峰會將于12月6日進行,聚焦大模型時代的軟硬件基礎設施關鍵技術與建設。

在AI Infra峰會上午場,上海交通大學副教授、無問芯穹聯合創始人兼首席科學家戴國浩將帶來開場報告,主題為《軟硬協同與多元異構,共筑大模型算力底座》。

北電數智智算云負責人郭文,GMI Cloud 亞太區總裁 King.Cui,阿里云智算集群產品解決方案負責人叢培巖,中昊芯英芯片軟件棧負責人朱國梁,光羽芯辰創始人兼董事長周強,將在AI Infra峰會上午場帶來主題演講,對全棧AI工廠、AI 企業出海如何補齊算力短板、高性能智算集群、通向個人大模型之路、國產 TPU 芯片 “No CUDA” 軟件棧進行分享。

楓清科技創始人兼CEO高雪峰,聲網生成式AI產品負責人毛玉杰,騰訊云向量數據庫技術負責人謝宇,Jina AI 聯合創始人兼首席技術官王楠,Zilliz合伙人、研發VP欒小凡,英飛流創始人兼CEO張穎峰,Alluxio首席架構師傅正佳將參與下午場,并分別針對“從數據到知識:AI 重塑百行千業的基石”、“生成式AI驅動實時互動的技術變革與體驗革新、TencentVDB向量數據庫、RAG范式下AI Infra的機遇和挑戰、“RAG雖強,但向量數據庫絕非萬靈藥”、新一代企業級多模態RAG引擎、高性能AI數據底座帶來主題分享。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

演講嘉賓:上海交通大學副教授、無問芯穹聯合創始人兼首席科學家 戴國浩

演講主題:《軟硬協同與多元異構,共筑大模型算力底座》

內容概要:在AI技術迅猛發展的今天,算力底座的不充分發展,已成為制約AI廣泛應用的主要瓶頸。本報告創新性地將影響AI模型算力供給的關鍵要素歸納為“軟硬協同”與“多元異構”,并集中探討了算力供給錯配的問題。深入分析AI在持續發展和應用落地過程中所面臨的算力挑戰,并從技術創新和產業實踐的角度出發,提出了一種創新的解決方案。該方案旨在持續擴大AI算力供給,提升面向大模型場景的token吞吐效率,降低大型模型部署的算力成本,以推動AI技術的持續進步,促進更多AI應用的成功落地,實現更廣泛的社會和經濟效益。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

演講嘉賓:北電數智智算云負責人 郭文

演講主題:《全棧“AI工廠”推動生成式AI可持續創新》

內容概要:回顧人類歷史上通用技術的發展,從技術的產生到社會經濟結構與生產模式發生根本性變化,需要生產工具和生產系統的整體變革才能促成。今天,洶涌而來的AI也是如此。未來,如何讓AI賦能千行百業,成為新質生產力?

本次演講,北電數智將帶來關于人工智能這項通用技術,在中外的產業發展格局差異,進行系統化變革面臨的挑戰,及北電數智在算力、算法、數據與生態構建方面,全面構建AI生產線的實踐思考,以期與產業各方共同推動AI產業的系統性變革,讓AI能夠真正被使用起來,成為真正的新質生產力。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

演講嘉賓:GMI Cloud 亞太區總裁 King.Cui

演講主題:《全球化布局:AI 企業如何補齊算力短板,保障GPU集群穩定性》

內容概要:隨著全球數字化進程的推進,越來越多的企業希望將自己的 AI 應用拓展到海外市場。然而,AI 出海面臨諸多挑戰,本次演講重點關注如何突破算力挑戰。

穩定的 GPU 集群對突破算力挑戰至關重要。GPU 集群能并行處理海量數據,其穩定性確保計算持續高效。通過合理架構設計、優質硬件支持、智能監控和維護系統等,可保障集群穩定,釋放強大算力。GMI Cloud作為一個基于高穩定性 GPU 集群的云計算平臺,便為 AI 應用出海提供一系列服務和支持。

本次演講,將介紹AI出海常見的基礎設施問題以及高穩定性的重要性,并著重探討如何利用 GMI Cloud 的優勢,幫助企業突破算力挑戰。之后,還將通過成功案例,分享 GMI Cloud 在不同行業應用的實踐經驗。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

演講嘉賓:阿里云智算集群產品解決方案負責人 叢培巖

演講主題:《高性能智算集群設計思考與實踐》

內容概要:2017年阿里云從多模態搜推場景的需求起步,開始投入智算集群的產品研發,2022年商業化發布,通過自動駕駛、LLM/VLM應用場景的持續打磨,目前已經服務了國內一半以上的大模型企業/科研機構。本次分享主要就智算集群的產品和方案設計方向,呈現阿里云的產品設計思考及實踐。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

演講嘉賓:光羽芯辰創始人兼董事長 周強

演講主題:《通向個人大模型之路》

內容概要:在當今時代,AI和大模型的應用已成為焦點。本演講將探討如何利用AI讓大模型更加智能,擴大其應用場景,以提高個人的工作效率和生活質量。我們將深入解析其工作原理和優勢,并通過實際案例展示大模型在個人服務中的具體應用。此外,本演講還將探討當前面臨的挑戰及未來發展方向,為您揭示通向個人大模型之路的關鍵所在。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

演講嘉賓:中昊芯英芯片軟件棧負責人 朱國梁

演講主題:《國產 TPU 芯片“No CUDA”軟件棧的構建實踐》

內容概要:國產自研高性能芯片面臨的諸多挑戰中,性能和生態是兩個不能避免的話題。英偉達的 CUDA 生態幫助了很多類 CUDA 架構公司解決了可用性和部分性能問題,但也帶來了諸多自主可控上的擔憂。

本次演講將從實際的芯片軟件棧構建思路出發,結合實際 AI 芯片軟硬件架構,介紹在真實的大模型落地實踐中,多層次軟件棧實現所面臨的問題、挑戰、以及過程中的選型決策。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

演講嘉賓:楓清科技創始人兼CEO 高雪峰

演講主題:《從數據到知識:AI 重塑百行千業的基石》

內容概要:隨著人工智能技術的快速發展,大模型成為了企業智能化的重要工具。然而,要讓這些模型真正為企業服務,不僅需要強大的技術,更需要找到技術與業務需求的結合點,充分利用企業多年積累的本地“知識”,構建“知識”為中心的支撐平臺,驅動豐富可信的智能化場景的建設。

本次分享將深入淺出地為大家分享如何通過以“數據”和“知識”為核心的方法,將企業的海量數據轉化為有價值的知識,并結合創新技術讓 AI 更高效、更可靠地解決實際問題。并通過真實案例展示如何幫助企業實現智能化轉型,讓 AI 技術融入到企業的場景價值當中,從而實現真正的AI+行業的轉型與落地。

楓清科技創立以來,一直堅持為客戶打造知識引擎與模型算法雙輪驅動的新一代智能體平臺,在多家行業龍頭企業的多智能場景的平臺建設中體現了其核心價值。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

演講嘉賓:聲網生成式AI產品負責人 毛玉杰

演講主題:《生成式AI驅動實時互動的技術變革與體驗革新》

內容概要:實時互動技術正經歷一場從“為人類設計”到“為人類與模型共同設計”的變革。過去十年,實時互動行業完成了從關注服務質量(QoS)到體驗質量(QoE)的跨越,推動用戶從“聽得到”到“聽得清”的感受提升。生成式AI的發展,正在開啟“跨模態QoE”時代,使實時互動從“聽得懂”向“聽得心”邁進。

此次演講主要探討生成式AI如何驅動實時互動的技術與體驗革命,深入剖析AI RTE產品的技術架構及其應用前景。通過解讀從服務端AI模塊到多模態交互的演進,探討技術如何突破模態限制,創造更加沉浸式的互動體驗。希望激發行業對未來AI RTE的無限可能的探索。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

演講嘉賓:騰訊云向量數據庫技術負責人 謝宇

演講主題:《TencentVDB向量數據庫在AI中的實踐》

內容概要:隨著AI應用的快速發展,向量數據庫逐步脫穎而出,越來越多的企業正在或考慮使用向量數據庫在企業中業務場景中落地,以發揮更大的數據價值,最終為企業起到降本增效的作用。騰訊云向量數據庫團隊積累了大量的客戶最佳實踐,在綜合效果、性能、成本等方面有深刻的理解,并致力于打造最好用的向量數據庫,在AI時代幫助更多的企業挖掘出更多的數據價值。

本次演講,謝宇將介紹向量數據庫的應用場景和行業中的定位,以及未來定位是什么,并分享VectorDB在RAG中提升效果的實踐技巧;此外,還將從索引結構、算法、成本邏輯、稀疏向量、Embedding、多租戶等方面闡述VectorDB向量數據庫的基本原理和應用實踐。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

演講嘉賓:Jina AI聯合創始人兼首席技術官 王楠

演講主題:《從長窗口到多向量:RAG范式下AI Infra的機遇和挑戰》

內容概要:在本次演講中,我們將深入探討RAG(Retrieval-Augmented Generation)范式在大模型的實際應用中遇到的機遇和挑戰。RAG不僅能夠補足大模型記憶的不準確性,還有效降低了注入新知識的成本,尤其是在私有知識的訪問方面表現出色。盡管長窗口大模型技術取得了長足進步,但其并不會取代RAG范式,反而推動了RAG依賴于支持長窗口輸入的向量模型的需求。我們將討論jina-embeddings作為全球首款支持8k窗口的開源向量模型的成功,以及長窗口輸入逐漸成為多模態向量模型的新標配。盡管如此,長窗口模型帶來了信息丟失和推理成本上升的挑戰,這也催生了多向量表示的需求,以彌補單一向量帶來的信息缺失。例如,ColBERT和ColPali分別針對文本和圖文內容提供了多向量表示方案,然而支持多向量的AI基礎設施仍然不足。此外,RAG的PoC階段面臨著GPU推理成本高、資源利用率低的問題,市場缺乏類似Modal lab的GPU共享服務。通過本次演講,我們將總結RAG范式的長期發展前景,闡明向量模型在長窗口和多模態輸入上的進化需求,并探討AI基礎設施如何更好地支持多向量表示和GPU共享,以降低RAG的應用成本。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

演講嘉賓:Zilliz 合伙人、研發VP 欒小凡

演講主題:《RAG雖強,但向量數據庫絕非萬靈藥》

演講概要:RAG(檢索增強生成)結合生成式AI與向量數據庫,為知識獲取與生成開辟了新路徑,但落地實踐中依然面臨數據質量、檢索效率、成本控制與安全性等挑戰。本次演講將深入探討RAG落地的關鍵實踐,向量數據庫如何在生成式AI時代發揮更大價值,以及其在性能、精準度與成本間的未來演進方向。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

報告嘉賓:英飛流創始人兼CEO 張穎峰

報告主題:《新一代企業級多模態RAG引擎》

內容概要:LLM正在對企業軟件生態進行重構,RAG已經成為企業級LLM應用的標準化架構。然而,RAG并非簡單的搜索系統,它需要針對來自企業的各種非結構化數據作出處理,準確識別用戶意圖,幫助LLM在上下文窗口內定位到足夠精準的片段,這就意味著它必須成為AI和Data協同工作的最具代表性的載體和場景。隨著LLM多模態能力的增強,RAG也需要步入多模態時代,它并不限于對日常圖片,音視頻的檢索增強,還應該涵蓋當下占據大部分的非結構化文檔,發掘出這些數據的商業價值。本次演講結合我們在過去的工作,從基礎設施角度來給出多模態RAG的工程實踐,以及未來如何迭代和演進的趨勢。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

演講嘉賓:Alluxio首席架構師 傅正佳

演講主題:《構建大模型時代的高性能AI數據底座》

內容概要:隨著AI技術的發展,尤其是大模型技術的應用,數據量呈現爆炸性增長。AI訓練和推理需要處理的數據集規模從幾TB增長到PB級別,與此同時,數據往往來自多個數據源,很多數據存放在不同的云服務中。當AI算力集群從這些數據源獲取數據時,很容易遭遇帶寬低下、延遲較高的困境,使算力資源的寶貴時間白白浪費在等待數據這一環節上。Alluxio 通過幫助企業構建大模型時代的高性能AI數據底座以應對I/O挑戰,提升AI算力的效率與性能,被廣泛應用于模型訓練與推理、自動駕駛、AI制藥、金融量化以及視頻渲染等場景。

本次演講,首先會介紹常見的 I/O 挑戰及其對 GPU 利用率和整體性能的影響,并著重講解如何將高性能數據訪問層無縫集成到 AI 流水線中,以減少 I/O 開銷。最后,將結合實際案例分享提高 AI 工作負載性能的緩存策略。

峰會下午還設置了圓桌討論環節,將由德聯資本執行董事劉景媛主持,Alluxio首席架構師傅正佳,Zilliz合伙人、研發VP欒小凡,英飛流創始人兼 CEO張穎峰三位嘉賓也將參與,共同探討《大模型行至深水區,AI Infra的新變化與新機會》。

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra

圓桌討論嘉賓:德聯資本執行董事 劉景媛

劉景媛女士擁有7年以上股權投資經驗,專注于底層軟件、AI、大數據等領域。加入德聯資本之前曾供職于金山云,亦有創業經歷。投資項目有Dify.AI、君同未來、云帆加速、Quickgame等,擁有清華大學和康奈爾大學碩士學位及北京大學學士學位。

四、報名通道臨近關閉 門票有限速來搶票

大會上海站設置了三類電子門票,分別是免費票通票貴賓票。免費票申請需經組委會審核,通票、貴賓票均需購買。

持免費票可參加兩場主會場峰會(大模型峰會、AI Infra峰會)。持有通票或貴賓票,除了可參加全部兩場主會場峰會,還可參加三場分會場研討會(端側生成式AI技術研討會、AI視頻生成技術研討會和具身智能技術研討會)。詳細權益,可通過文末左下角「閱讀原文」,直達官網了解后,進行免費票申請或購票參會。

再次提醒!!觀眾報名通道臨近關閉。著急的朋友,也可以掃描下方二維碼添加小助手“泡泡”申請免費票或購買門票。已添加過“泡泡”的老朋友,可以給“泡泡”私信,發送“GenAI24”即可報名。

已經申請或購買了門票的朋友們,近期請注意查收來自小助手“泡泡”的微信通知(優先微信,并輔以短信或電話)。屆時請務必及時查看并保存您的門票憑證,這是現場參會簽到需要的哦~

GenAICon 2024上海站主會場議程公布!34位學者專家全景式解構大模型與AI Infra