1、馬斯克(ke)Grok大模型開源(yuan) 參數(shu)量3410億(yi)

2、蘋果(guo)谷(gu)歌和(he)OpenAI商談iPhone大模型使用

3、蘋果新(xin)研(yan)究提升服務大模型效率

4、Open-Sora視(shi)頻(pin)生成(cheng)模型(xing)開源

5、AI程(cheng)序(xu)員代碼能力超Claude 2

6、月(yue)之暗(an)面智能助手支持200萬(wan)字上下文(wen)

7、斯坦(tan)福新研(yan)究(jiu)提升(sheng)大(da)模型長視頻理解能力

8、高通手機芯片(pian)支持100億參數大模型

9、國內首(shou)個AI導演上崗

10、賽(sai)迪四川發(fa)布中國(guo)AI大(da)模型20強報告(gao)

11、OpenAI CTO說(shuo)不(bu)知(zhi)道Sora訓練數據出處

12、阿(a)聯酋AI投資公司(si)考(kao)慮支持(chi)OpenAI萬億芯(xin)片(pian)計劃

1、馬斯克Grok大模型開源 參數量3410億

今天,馬斯克的(de)AI創企(qi)xAI正式發布了大模型Grok-1,其(qi)參(can)數(shu)量達到了3140億,超過OpenAI GPT-3.5的(de)1750億。這是(shi)迄(qi)今參(can)數(shu)量最大的(de)開源大語言(yan)模型,遵照Apache 2.0協議開放模型權重和架構。Grok-1是(shi)一個混合專家(Mixture-of-Experts,MoE)大模型。xAI稱這是(shi)他們(men)自己從(cong)頭(tou)訓練的(de)大模型,Grok-1沒有針對(dui)特定(ding)應用進(jin)行微調。

2、蘋果谷歌和OpenAI商談iPhone大模型使用

今天,據彭博(bo)社報道,有知情人士稱(cheng),蘋果(guo)公(gong)司正在(zai)與谷歌進行(xing)談判,希望(wang)將谷歌的(de)Gemini大模型能力(li)應用在(zai)iPhone中,以支(zhi)持今年iPhone即將增加的(de)各類(lei)生(sheng)成式(shi)AI功(gong)能。彭博(bo)社記者馬克·古(gu)爾曼認(ren)為,這將是一項重大的(de)協議(yi),可能會撼動整個AI行(xing)業(ye)。該報道還(huan)提到,蘋果(guo)最近與OpenAI進行(xing)了討論,考慮使用其(qi)大模型。

3、蘋果新研究提升服務大模型效率

3月14日,蘋(pin)果(guo)研(yan)究人員(yuan)發布論(lun)文,推(tui)出(chu)了一種(zhong)用于大型(xing)(xing)語(yu)(yu)言模(mo)(mo)(mo)(mo)型(xing)(xing)中快速(su)推(tui)測(ce)解碼的Recurrent Drafter,這種(zhong)改(gai)進后的推(tui)測(ce)解碼方法(fa)可以提高(gao)服務大型(xing)(xing)語(yu)(yu)言模(mo)(mo)(mo)(mo)型(xing)(xing)的效率(lv)。Recurrent Drafter利用了雙模(mo)(mo)(mo)(mo)型(xing)(xing)推(tui)測(ce)解碼方法(fa)和單模(mo)(mo)(mo)(mo)型(xing)(xing)方法(fa)Medusa。研(yan)究人員(yuan)通過(guo)實(shi)驗證明了這種(zhong)方法(fa)在幾(ji)個主流開源大型(xing)(xing)語(yu)(yu)言模(mo)(mo)(mo)(mo)型(xing)(xing)上的有效性。

論文地址:

//arxiv.org/pdf/2403.09919.pdf

HuggingFace地址:

//huggingface.co/papers/2403.09919

4、Open-Sora視頻生成模型開源

3月18日凌晨(chen)(chen),潞晨(chen)(chen)科(ke)技(ji)創始(shi)人(ren)尤洋教授在X平臺發(fa)文,潞晨(chen)(chen)科(ke)技(ji)旗下(xia)Colossal-AI團(tuan)隊(dui)開源了其Open-Sora 1.0視頻(pin)生(sheng)成(cheng)模(mo)型(xing)(xing),包括模(mo)型(xing)(xing)權重、訓練源代碼和詳(xiang)細的架(jia)(jia)構(gou)。該模(mo)型(xing)(xing)采用(yong)了Diffusion Transformer(DiT)架(jia)(jia)構(gou)。據了解,團(tuan)隊(dui)以使(shi)用(yong)了DiT架(jia)(jia)構(gou)的開源文生(sheng)圖模(mo)型(xing)(xing)PixArt-α為基礎,引入了時間注意力層(ceng),并將其擴(kuo)展到了視頻(pin)數據上。

GitHub地址:

//github.com/hpcaitech/Open-Sora

5、AI程序員代碼能力超Claude 2

3月15日,AI創企Cognition對其團隊發布的首個(ge)(ge)AI軟件(jian)工程師(shi)Devin進行了技(ji)術解(jie)讀(du),發布了關于Devin的SWE-bench基準測試(shi)技(ji)術報告。SWE-bench可以(yi)評估系統解(jie)決(jue)現實中(zhong)代(dai)碼庫(ku)問(wen)(wen)題(ti)的能力。測試(shi)結果顯(xian)示,Devin不需(xu)要人(ren)類輔助就(jiu)可以(yi)解(jie)決(jue)570個(ge)(ge)問(wen)(wen)題(ti)中(zhong)的79個(ge)(ge)問(wen)(wen)題(ti),成功率為13.86%,高于SOTA 大模(mo)型(Claude 2)的4.80%。

GitHub地址:

//github.com/CognitionAI/devin-swebench-results

6、月之暗面智能助手支持200萬字上下文

今(jin)(jin)天,AI創企月之暗面(Moonshot AI)宣布其智(zhi)能助手(shou)Kimi在長(chang)上(shang)(shang)下(xia)文窗口技(ji)術上(shang)(shang)取得突破,無(wu)損(sun)上(shang)(shang)下(xia)文長(chang)度提升(sheng)至200萬(wan)(wan)(wan)字(zi)。今(jin)(jin)天起(qi),支持200萬(wan)(wan)(wan)字(zi)上(shang)(shang)下(xia)文的Kimi已(yi)啟動(dong)內(nei)測。據稱,基于新版Kimi,用戶(hu)上(shang)(shang)傳幾(ji)十萬(wan)(wan)(wan)字(zi)的經典德州撲克長(chang)篇教程后,Kimi可以扮演(yan)德撲專家(jia)為用戶(hu)提供出牌策略的指(zhi)導。

7、斯坦福新研究提升大模型長視頻理解能力

3月15日,斯(si)坦福(fu)研究人員發布論文,推出(chu)了一種基于代理(Agent)的(de)系統——VideoAgent,其將大型語言模型作為(wei)中央代理,迭代地(di)識別(bie)和編譯(yi)關鍵信(xin)息(xi)以回答問題,同(tong)時利用視覺(jue)(jue)語言基礎模型作為(wei)翻譯(yi)和檢索視覺(jue)(jue)信(xin)息(xi)的(de)工具。在EgoSchema和NExT-QA基準測(ce)試(shi)中,VideoAgent在零樣本準確率(lv)上(shang)分別(bie)達到了54.1%和71.3%,平均僅使用了8.4和8.2幀。研究人員稱(cheng),該(gai)測(ce)試(shi)結果表(biao)明該(gai)方(fang)法(fa)在效(xiao)果和效(xiao)率(lv)上(shang)優于當前最先進的(de)方(fang)法(fa),在提升長篇視頻理解方(fang)面有應用潛力。

論文地址:

//arxiv.org/pdf/2403.10517.pdf

GitHub地址:

//wxh1996.github.io/VideoAgent-Website/

8、高通手機芯片支持100億參數大模型

今(jin)天,高(gao)通正式(shi)(shi)發(fa)布了第三代驍龍8s芯片(pian),其(qi)在端側(ce)生成(cheng)式(shi)(shi)AI能(neng)力方(fang)面(mian)進(jin)行了重點升級(ji),支持Baichuan-7B、Gemini Nano、Llama 2和(he)智譜ChatGLM等(deng)30多個(ge)大型(xing)語言模型(xing)和(he)大型(xing)視覺模型(xing),據稱(cheng)最(zui)高(gao)支持模型(xing)參數量為(wei)100億。

9、國內首個AI導演上崗

據上海(hai)證券報報道,3月(yue)15日,湖南(nan)廣電集團首個(ge)AI導演愛(ai)芒(英文名AIM)正(zheng)式以助理(li)導演的(de)身份和觀眾、網(wang)友們(men)見面。這也是國內首個(ge)正(zheng)式上崗(gang)的(de)AI導演。3月(yue)17日午間,該綜藝超前企劃播(bo)出,愛(ai)芒正(zheng)式亮相。《聲生不息》系列制片人(ren)洪嘯(xiao)說(shuo):“AI導演會倒逼(bi)著我們(men)不斷地去創(chuang)新。”

10、賽迪四川發布中國AI大模型20強報告

智東西3月(yue)17日消(xiao)息(xi),3月(yue)15上午,賽迪工(gong)業(ye)和信息(xi)化研(yan)究(jiu)院(集團)四川(chuan)有(you)限公司發布了(le)《2024中國人工(gong)智能多模(mo)態大模(mo)型(xing)企(qi)業(ye)綜合競爭力20強研(yan)究(jiu)報告》,騰訊混元大模(mo)型(xing)排(pai)名(ming)(ming)第(di)一(yi)、科(ke)大訊飛(fei)星火大模(mo)型(xing)排(pai)名(ming)(ming)第(di)二、阿里巴(ba)巴(ba)通義千問(wen)排(pai)名(ming)(ming)第(di)三、華為盤(pan)古大模(mo)型(xing)排(pai)名(ming)(ming)第(di)四、智譜華章(zhang)智普清(qing)言排(pai)名(ming)(ming)第(di)五。

據稱此次(ci)評(ping)價(jia)研究(jiu)通過(guo)建立覆蓋經濟、技術、行業、商(shang)業等多維度指標的企業競(jing)爭(zheng)力(li)(li)(li)評(ping)價(jia)模型,對我國人工智能自研多模態(tai)大模型企業實力(li)(li)(li)進(jin)行綜合(he)評(ping)估,最終形成人工智能多模態(tai)大模型企業綜合(he)競(jing)爭(zheng)力(li)(li)(li)20強評(ping)價(jia)結果。其評(ping)價(jia)體(ti)系包括經濟抗衡力(li)(li)(li)(15%)、行業影響力(li)(li)(li)(30%)、技術競(jing)爭(zheng)力(li)(li)(li)(40%)、商(shang)業角逐力(li)(li)(li)(15%)。

11、OpenAI CTO說不知道Sora訓練數據出處

智東(dong)西(xi)3月(yue)17日(ri)消(xiao)息,3月(yue)14日(ri),《華爾(er)街日(ri)報》記者Joanna Stern采訪了(le)OpenAI首(shou)席技術官Mira Murati,針對一(yi)段Sora生成的(de)(de)虛擬(ni)視頻(pin)進(jin)行了(le)討論(lun),Mira Murati解釋了(le)Sora的(de)(de)工作原理,但(dan)是(shi)回避(bi)了(le)大部分有關(guan)該模(mo)型訓(xun)練(lian)數據(ju)來源(yuan)的(de)(de)問題,甚至在回答中出(chu)現(xian)了(le)“我其實(shi)不(bu)太確定(I’m actually not sure about that)”的(de)(de)說法。

12、阿聯酋AI投資公司考慮支持OpenAI萬億芯片計劃

智東(dong)西(xi)3月17日消(xiao)息(xi),據英國(guo)《金(jin)融時(shi)報》報道(dao),阿聯酋(qiu)阿布扎比一(yi)家(jia)由國(guo)家(jia)資助的(de)(de)投資公司MGX正在和OpenAI談(tan)判,討論支持此(ci)前由OpenAI CEO Sam Altman提出的(de)(de)“萬億芯片計(ji)劃”。報道(dao)稱,MGX 是一(yi)家(jia)今年1月剛剛成立的(de)(de)專注于AI的(de)(de)投資公司,代(dai)表(biao)了阿聯酋(qiu)希望(wang)在全球AI競賽中實現(xian)領先的(de)(de)關鍵(jian)布局。