1、阿里發布肖像視頻生成框架EMO

2、Pika推出“對口型”功能

3、傳蘋果放棄電動汽車制造轉向生成式AI

4、特斯拉APP推出AI聊天助手測試版

5、Gemini 1.5通過視頻成功修復Bug

6、谷歌將進行結構性調整以解決Gemini偏見問題

7、研究顯示Gemini等在選舉上存在偏見

8、傳谷歌向媒體付費測試AI寫作工具

9、扎克伯格拜訪日韓討論AI、XR合作

10、OpenAI稱《紐約時報》侵權指控存在欺騙行為

11、歐盟監管機構擬審查微軟對Mistral的投資

12、GitHub推出企業版Copilot

13、微軟正測試Copilot GPT

14、百度2023年凈利潤漲39%

15、百度Comate啟動眾測活動

16、螞蟻集團推出多模態遙感模型SkySense

17、魅族Aicy語音助手接入AI大模型

18、OPPO Reno11系列將引入生成式AI功能

19、南京大學開設AI通識核心課程體系

20、傳Tumblr等計劃將數據出售給AI公司

21、Prophesee與高通合作進入可量產階段

22、芯片大神Jim Keller創企與日企合作設計AI芯片

23、法AI圖像創企獲4300萬美元融資

24、字節推出MegaScale 將LLM訓練擴展到1萬個GPU

1、阿里發布肖像視頻生成框架EMO

今日,來自阿里巴巴的團隊發布了音頻驅動的肖像視頻生成框架EMO(Emote Portrait Alive),相關論文同步發表于arXiv。輸入一張參考圖像和聲音音頻,該框架能夠生成具有豐富面部表情和頭部姿勢的聲音肖像視頻。

論文地址:

arxiv.org/pdf/2402.17485.pdf

項目主頁:

humanaigc.github.io/emote-portrait-alive/

2、Pika推出“對口型”功能

昨晚,AI視頻生成平臺Pika宣布推出為生成視頻中的人物配音,并同時“對口型”的唇形同步功能LipSync,目前僅支持Pro用戶體驗。其中,音頻生成部分由AI語音克隆創企ElevenLabs提供技術支持。

3、傳蘋果放棄電動汽車制造轉向生成式AI

據彭博社援引知情人士消息報道,蘋果在當地時間周二于公司內部宣布取消長達十年的電動汽車項目,從事該項目的近2000名員工中的許多人將被轉到由約翰·詹南德雷亞(John Giannandrea)領導的AI部門,專注于生成式人工智能項目。

4、特斯拉APP推出AI聊天助手測試版

據electrek報道,特斯拉今日更新了移動端應用程序,推出測試版聊天助手,可以回答有關特斯拉或其他產品的問題。

5、Gemini 1.5通過視頻成功修復Bug

昨日,社交平臺X博主Mckay Wrigley稱Gemini Pro 1.5通過視頻和文本成功修復了問題代碼。他將整個代碼庫以文本形式發送給Gemini Pro 1.5,并同時上傳了攝像頭拍攝的三個出錯的程序界面,輸入“請幫我修復代碼中的所有Bug”等提示詞,Gemini直接給出了問題代碼位置和解決方案。

6、谷歌將進行結構性調整以解決Gemini偏見問題

據Semafor今日報道,谷歌CEO桑達爾·皮查伊(Sundar Pichai)在當地時間周二晚間回應了Gemini的種族偏見爭議,稱該問題“不可接受”,并發誓要進行結構性調整來解決問題。他在內部信中說,公司在修復Gemini護欄方面已經取得了進展,“我們的團隊一直在夜以繼日地工作來解決這些問題。我們已經看到各種提示都得到了顯著的改進。”

7、研究顯示Gemini等在選舉上存在偏見

據非盈利新聞工作室Proof今日發布的報告,GPT-4、Llama 2、Gemini、Mixtral和Claude等領先的五個AI文本模型在26個選舉相關問題上準確性表現不佳,超過一半的相應被AI專家評委不準確,40%的回答被評為有害。其中,Gemini、Llama2和Mixtral的不準確答案率最高,均超過60%。

8、傳谷歌向媒體付費測試AI寫作工具

據ADWEEK昨日報道,谷歌上個月為少數獨立出版商推出一項計劃,為后者提供未發布的生成式AI平臺測試版訪問權限,來換取分析和反饋。作為協議的一部分,出版商將使用該工具套件在12個月內每天發布3篇內容,每月可以獲得五位數的津貼。

9、扎克伯格拜訪日韓討論AI、XR合作

據路透社報道,Meta CEO扎克伯格周二拜訪了東京,與日本首相岸田文雄討論了AI問題。周二晚間,他抵達韓國,并于今日會見了LG電子CEO、LG母公司COO,討論下一代XR設備開發相關業務,以及在AI領域的潛在合作。

10、OpenAI稱《紐約時報》侵權指控存在欺騙行為

據The Verge報道,OpenAI在當地時間周一提交的一份動議中稱,《紐約時報》使用“欺騙性提示”讓ChatGPT重復其內容,并請求紐約南部的美國地方法院駁回《紐約時報》版權侵權訴訟中的幾項索賠。

11、歐盟監管機構擬審查微軟對Mistral的投資

據The Information報道,歐洲最高反壟斷監管機構歐盟委員會當地時間周二稱,計劃審查微軟對法國生成式AI初創公司Mistral的投資。微軟于周一宣布與Mistral建立合作伙伴關系,向Mistral投資1630萬美元,并在云平臺Azure中提供Mistral的模型。

12、GitHub推出企業版Copilot

微軟旗下的GitHub今日推出Copilot Enterprise,可根據企業內部的代碼和知識庫定制,每人每月39美元。

13、微軟正測試Copilot GPT

昨日,微軟副總裁兼Copilot和必應工程與產品負責人約爾迪·里巴斯(Jordi Ribas)透露,微軟正在測試Copilot GPT,當用戶打開Microsoft Copilot時會出現一個新的Copilot GPT列表,可為用戶提供健身訓練計劃、計劃假期和幫助烹飪等功能。

14、百度2023年凈利潤漲39%

據百度微信公眾號今日發文,其2023年營收為1345.98億元,凈利潤287億元,同比增長39%;其第四季度營收349.51億元,凈利潤77.55億元,同比增長44%。其中,AI成為增長新動力,百度智能云、PP飛槳等AI平臺高速增長,千帆大模型平臺累計精調模型1萬個,AI出行平臺蘿卜快跑第四季度提供乘車服務83.9萬次。

15、百度Comate啟動眾測活動

據百度安全應急響應中心微信公眾號今日發文,百度智能編程工具Comate及千帆大模型平臺開啟專項加碼眾測活動,活動時間為2月29日-3月12日,單個漏洞獎勵最高可達3萬元。

16、螞蟻集團推出多模態遙感模型SkySense

螞蟻集團今日宣布推出20億參數多模態遙感基礎模型SkySense,這是螞蟻百靈大模型在多模態領域最新的研發成果,其論文已被世界計算機視覺頂會CVPR 2024接收。數據顯示,SkySense在17項測試場景中指標均超過國際同類產品,可用于地貌、農作物觀測和解譯等,有效輔助農業生產和經營。

17、魅族Aicy語音助手接入AI大模型

據IT之家報道,魅族21系列手機今日獲推Flyme 10.5.0.1A穩定版系統,語音助手小溪(Aicy)接入大模型,支持自然語言對話、文檔總結、知識問答、出行規劃、運動健康建議、文案生成等AI功能。

18、OPPO Reno11系列將引入生成式AI功能

昨日,OPPO在2024年世界移動通信大會(MWC 2024)宣布將全面發力AI領域。OPPO還宣布,今年第二季度,全球OPPO Reno11系列及OPPO Find N3也將引入包括AI消除功能在內的一系列生成式AI功能。

19、南京大學開設AI通識核心課程體系

昨日,南京大學宣布將面向全體本科新生開設“人工智能通識核心課程體系”。南京大學將建設“1+X+Y”三層次“人工智能通識核心課程體系”,以1門必修的AI通識核心課+X門AI素養課+Y門個學科與AI深度融合的前沿拓展課為基礎,從知識、能力、價值觀與倫理三個維度開展教育教學。

20、傳Tumblr等計劃將數據出售給AI公司

據404 Media今日援引內部文件報道,社交平臺Tumblr和博客網站WordPress.com的所有者正在與AI公司Midjourney和OpenAI進行談判,以提供從用戶帖子中抓取的訓練數據。

21、Prophesee與高通合作進入可量產階段

神經擬態視覺傳感公司Prophesee 2月27日宣布與高通的合作進入可量產階段。在巴塞羅那世界移動通信大會MWC 2024期間,Prophesee展示了其解決方案與驍龍旗艦移動平臺的原生兼容性,以及神經擬態視覺技術為智能手機攝像頭帶來的速度、能效和成像質量方面的提升。Prophesee Metavision事件視覺傳感器和AI算法針對驍龍平臺進行了優化,使運動模糊消除的效果和整體圖像的質量都得到前所未有的提升,尤其是在快速移動和低光等傳統基于幀的RGB傳感器難以應對的場景中。

22、芯片大神Jim Keller創企與日企合作設計AI芯片

根據彭博社昨日報道,日本政府投資的半導體研發集團Rapidus將與加拿大芯片創企Tenstorrent合作設計其首款AI芯片。Tenstorrent將授權其設計日本AI加速器的一部分,并與Rapidus共同設計整個芯片。Tenstorrent成立于2016年,首席執行官為芯片界大神吉姆·凱勒(Jim Keller)。Rapidus成立于2022年,計劃在2027年開始芯片生產,與臺積電和三星電子等公司競爭。

23、法AI圖像創企獲4300萬美元融資

據TechCrunch昨日報道,法國AI圖像編輯器創企Photoroom近期以5億美元估值完成了4300萬美元融資,Balderton Capital領投此輪融資,新投資者Aglaé和之前的投資者Y Combinator參投。Photoroom目前擁有約50名員工,計劃利用這筆融資雇用更多員工,并投資于研發和基礎設施。

24、字節推出MegaScale 將LLM訓練擴展到1萬個GPU

2月24日,來自字節和北大的團隊在arXiv上發表論文,提出大模型生產系統MegaScale。MegaScale將大型語言模型訓練擴展到超過10000個GPU,在12288個GPU上訓練175B LLM模型時,MegaScale實現了55.2%的模型FLOP利用率(MFU),與層內模型并行技術Megatron-LM相比,MFU提高了1.34倍。

論文地址:

//arxiv.org/abs/2402.15627