1、李飛飛谷歌聯合發布AI視頻擴散模型W.A.L.T
2、馬斯克Grok出現幻覺 自稱是OpenAI產品
3、OpenAI聯創10年前論文獲NeurIPS 2023時間檢驗獎
4、法國AI創企Mistral估值達20億美元
5、Mistral AI發布專家混合模型Mixtral 8x7B
6、Runway宣布開展通用世界模型研發
7、微軟與美國勞聯-產聯合作 確保AI為工人服務
8、網信辦:整治AI生成虛假短視頻內容
9、阿里云前首席安全科學家創業個人AI計算機
10、京東前副總裁AI創企獲科大訊飛領投新融資
11、傳華為云大模型核心成員顧曉韜加入智譜AI
12、零一萬物再度澄清套殼爭議
13、社交平臺Soul推出自研大模型SoulX
14、海通證券發布“泛海言道”金融大模型
1、李飛飛谷歌聯合發布AI視頻擴散模型W.A.L.T
今日凌晨,李飛飛的斯坦福團隊與谷歌聯合發布用于生成逼真視頻的擴散模型W.A.L.T,基于Transformer訓練而成,支持文生視頻、圖生視頻和3D攝像機運動。據介紹,該方法有兩個關鍵的設計,一是使用因果編碼器,在統一的潛空間內聯合壓縮圖像和視頻,從而實現跨模態的訓練和生成;二是為了提高記憶和訓練效率,使用了為空間和時空聯合生成建模量身定制的窗口注意力架構。最后,團隊針對文本到視頻的生成任務訓練了由三個模型組成的級聯,包括一個基本潛在視頻擴散模型和兩個視頻超分辨率擴散模型,能夠以每秒8幀的速度生成分辨率為512*896的視頻。
項目地址:walt-video-diffusion.github.io/
論文地址:walt-video-diffusion.github.io/assets/W.A.L.T.pdf

2、馬斯克Grok出現幻覺 自稱是OpenAI產品
近日有多名網友反饋,馬斯克xAI公司的聊天機器人Grok出現“幻覺”問題。職業黑客Jax Winterbourne在進行紅隊測試時發現,當他要求Grok創建惡意軟件時,Grok會回復“我無法滿足您的要求,因為這有悖于OpenAI的政策”,因此質疑Grok抄襲了OpenAI的代碼庫。對此,xAI技術人員Igor Babuschkin回應道:“這里的問題是,網絡上充滿了ChatGPT輸出,因此我們在使用大量網絡數據進行訓練時,不小心收集到了其中一些。當我們第一次注意到這個問題時,我們感到非常驚訝。不管怎么說,這個問題非常罕見。既然我們已經意識到了,就會確保未來版本的Grok不會出現這個問題。別擔心,Grok沒有使用OpenAI的代碼。”

但也有網友對他說的“罕見”提出質疑。博主@ideasthesia跟帖稱:“只是為了給幻覺問題提供更多例子,它可能并不像你想象的那么罕見。”并上傳了一張截圖,當他問Grok世界上最強的大模型是什么時,Grok回答是“xAI公司創建的GPT4”。

3、OpenAI聯創10年前論文獲NeurIPS 2023時間檢驗獎
今日,神經信息處理系統大會NeurIPS公布了今年的獲獎論文,包括時間檢驗獎、兩篇杰出論文 、兩篇杰出論文亞軍(Runner-Ups )、兩篇優秀數據集和基準論文,其中大部分論文都圍繞大型語言模型展開。獲得時間檢驗獎的是一篇10年前由谷歌團隊發布的論文,作者包括現在的OpenAI首席科學家Ilya Sutskever。NeurIPS稱,該論文介紹了開創性的詞嵌入技術word2vec,展示了從大量非結構化文本中學習的力量,促進了標志著自然語言處理新時代開始的進步,被引量超過4萬次。
論文地址:arxiv.org/pdf/1310.4546

4、法國AI創企Mistral估值達20億美元
據彭博社昨日報道,法國AI創企Mistral完成了新一輪4.15億美元融資(約合人民幣29.8億元),本輪融資對該公司的估值約為20億美元(約合人民幣143.5億元)。該公司在周一的一份聲明中稱,本輪融資由硅谷風險投資公司Andreessen Horowitz和初始支持者光速創投(Lightspeed Ventures)牽頭。Mistral由來自谷歌DeepMind和Meta的科學家創立,成立僅7個月,其最新發布的專家模型在基準測評中超越Llama 2,對標GPT-3.5。
5、Mistral AI發布專家混合模型Mixtral 8x7B
繼上周五突然開源8x7B模型但未作任何介紹后,今日,法國AI創企Mistral AI于官網宣布正式發布該模型,名為Mixtral 8x7B,是一個具有開放權重的高質量稀疏專家混合模型(SMoE)。據介紹,該模型采用Apache 2.0許可,在大多數基準測試中的表現都優于Llama 2 70B且推理速度快6倍,測評成績能與GPT-3.5相媲美,甚至優于GPT-3.5。Mixtral可以處理32k長度的上下文,支持英語、法語、意大利語、德語和西班牙語,具有強大的代碼生成能力。具體來說,Mixtral擁有467億總參數,但每個令牌只使用129億個參數。因此,它處理輸入和生成輸出的速度和成本與12.9B模型相同。
同時,Mistral開放了第一個平臺服務的測試版,該平臺目前提供三個聊天端點,用于根據文本指令生成文本,還有一個嵌入端點。據介紹,前兩個端點(mistral-tiny和mistral-small)分別使用Mistral 7B和剛發布的Mixtral 8x7B;第三個端點(mistral-medium)使用的是性能更高的原型模型,該模型目前仍在部署環境中測試。
平臺地址:console.mistral.ai

6、Runway宣布開展通用世界模型研發
昨日晚間,AI創企Runway于官網宣布開展圍繞通用世界模型(General World Models)的長期研究工作,目標是表現和模擬與現實世界中一致的廣泛的互動。Runway稱,其目前的Gen-2等視頻生成系統可以看作是非常早期的通用世界模型,對物理和運動有一定的了解,但在處理復雜的攝像機或物體運動等問題上仍有困難。為了建立通用的世界模型,Runway正在進行幾項公開的研究,包括生成環境地圖,在環境中導航和交互,捕捉世界和世界中居民的動態,建立逼真的人類行為模型等。
7、微軟與美國勞聯-產聯合作 確保AI為工人服務
據美通社報道,昨日,微軟宣布與美國勞工聯合會-產業工會聯合會(AFL-CIO)就AI和勞動力達成合作協議。為確保AI為美國工人服務,將主要實現三個目標:1、與工會領袖和工人分享有關AI技術趨勢的深度信息;2、將工人的觀點和專業知識納入AI技術的開發;3、幫助制定支持一線工人技術技能和需求的公共政策。
8、網信辦:整治AI生成虛假短視頻內容
據網信中國微信公眾號今日發文,12月5日,中央網信辦開展為期一個月的“清朗·整治短視頻信息內容導向不良問題”專項行動。其中提到,集中整治技術生成虛假短視頻,包括使用AI等技術編造、拼接內容,違法使用他人肖像和聲音進行人臉替換或人聲合成,生成虛假短視頻。
9、阿里云前首席安全科學家創業個人AI計算機
企查查信息顯示,今日,杭州云麓知道科技有限公司發生企業名稱變更,變更為“杭州半個宇宙科技有限公司”,同時企業人員發生重大變更,法定代表人、大股東從張宏變更為吳翰清。官網顯示,KMind(半個宇宙)公司由前阿里巴巴研究員吳翰清(道哥)聯合2名聯合創始人和13名創始團隊成員于2023年創立,并于12月推出“半個宇宙”操作系統,提供一個由kOS驅動的個人AI計算機給所有普通用戶使用,幫助人們處理數據。KMind的使命是發明新型的個人AI計算機(PAIC,Personal AI Computer),打破當代互聯網大公司的數據壟斷,讓數據為個人、小微企業創造價值,最終實現自由、開放、共享、平等的AI互聯網。據悉,吳翰清曾任阿里云首席安全科學家、云盾負責人,于今年5月從阿里離職,當時曾有媒體報道稱他將投身于AI短視頻賽道創業。
半個宇宙官網地址:kmind.cn

10、京東前副總裁AI創企獲科大訊飛領投新融資
據36氪報道,AI創企HiDream.ai近期完成新一輪融資,由科大訊飛創投基金領投,將門創投等多家機構跟投。其中,上一輪投資的阿爾法公社、中喝大種子一號基金再次跟投。本輪融資將用于產品研發、電商場景的市場拓展和C端產品出海方向的發展等。據悉,HiDream.ai由前京東集團副總裁、京東探索研究院副院長梅濤博士于2023年初創立,定位于圍繞視覺方向,打造生成式多模態基礎模型及應用。
11、傳華為云大模型核心成員顧曉韜加入智譜AI
據AI科技評論今日報道,華為云大模型團隊一核心技術骨干顧曉韜近日將離職,加入智譜AI。據悉,顧曉韜主要參與華為云的NLP與大模型研發工作,是盤古大模型的三個算法負責人之一,負責預訓練,其他兩人是負責監督微調的史佳欣與負責強化的朱疆成。本科期間,顧曉韜曾進入清華大學知識工程實驗室做科研實習,師從智譜AI創始人唐杰,做數據挖掘、模型訓練等方面的相關研究。他參與了清華大學Aminer數據挖掘系統開發工作,并獲得一項“基于人名的郵箱地址推薦方法及系統”的專利,而Aminer由唐杰主導,也是智譜AI起家的第一塊業務。
12、零一萬物再度澄清套殼爭議
據DoNews昨日報道,零一萬物稱,公司內部經過幾個周的國際國內法律研判,已經確認完全不涉及套殼、抄襲,并給出了進一步的澄清。此前,向零一萬物官方發郵件建議修改張量名稱的Eric Hartford也于社交平臺X上為其澄清,稱零一萬物“沒有在任何事情上撒謊,他們從零開始使用自己創建的數據集訓練Yi,對開源領域的貢獻是值得贊揚的”。此外據零一萬物微信公眾號昨日發文,Yi-34B系列模型近期在斯坦福大學研發的大語言模型評測AlpacaEval Leaderboard中,以94.08%的勝率超越Llama 2、Claude 2、ChatGPT等模型,成為世界范圍內僅次于GPT-4英語能力的大語言模型,并且是經由Alpaca官方認證為數不多的開源模型。同一周,在加州大學伯克利分校主導的LMSYS ORG排行榜中,Yi-34B-Chat以1102的Elo評分,晉升最新開源SOTA開源模型之列,性能表現追平GPT-3.5。
模型地址:
huggingface.co/01-ai/
modelscope.cn/organization/01ai
13、社交平臺Soul推出自研大模型SoulX
據新浪科技報道,新型社交平臺Soul近日宣布上線自研語言大模型SoulX。據了解,該模型基于海量數據訓練,具備Prompt驅動、條件可控生成、上下文理解、多模態理解等能力。在保證對話流暢、自然、具備情感溫度的同時,能覆蓋百種細粒度風險類別,通過訓練數據安全篩選、安全SFT數據構造、RLHF安全對齊、推理攔截等策略來構建安全體系,保證了大模型的內容生產質量和安全性。
14、海通證券發布“泛海言道”金融大模型
據海通證券微信公眾號發文,12月10日,在第五屆上海金融科技國際論壇智慧金融平行論壇上,海通證券正式發布“泛海言道”大模型。據介紹,“泛海言道”綜合應用前沿大模型技術,成功落地智能問答、智能研報、智能研發等業務場景,可結合互聯網檢索引擎,為外部客戶和內部員工提供即時、高質量的問答服務;通過樣例示范學習能力,深度解讀、分析財報數據,生成研報初稿,為研究人員提供專業可靠的寫作服務;可嵌入開發環境,快速識別開發人員代碼需求,支持多種編程語言,自動生成高質量程序,為開發人員提供高效研發服務。