1、小度科技原CEO景鯤辭任 百度CIO李瑩接任
2、雷軍通過小米和順為連番注資百川智能
3、曝OpenAI擬自研AI芯片 計劃收購公司
4、微軟宣布Bing Chat等免費提供DALL-E 3服務
5、微軟發布166頁多模態大模型GPT-4V說明書
6、傳微軟將于下月推出首款AI芯片
7、研究稱GPT-4審稿意見與人類評審一致性超50%
8、ChatGPT成功預測mRNA疫苗獲諾獎
9、谷歌虛擬助手將集成Bard登陸手機
10、谷歌AI自主設計芯片論文遭Nature調查
11、DeepMind等發布具身機器人數據集和RT-X模型
12、Meta發布Llama 2 Long,支持3.2萬Tokens
13、Meta等發布StreamingLLM框架 支持400萬Tokens
14、傳亞馬遜明年1月將AI集成至電商搜索欄
15、Stability AI發布面向移動設備的Stable LM 3B
16、三星Exynos 2400芯片亮相 AI處理快14.7倍
17、AI創企Jasper CEO辭職,Dropbox前總裁接任
18、CAIS等機構學者提出可檢測LLM撒謊的內部表征
19、商湯科技49篇論文入選ICCV 2023
1、小度科技原CEO景鯤辭任 百度CIO李瑩接任
據36氪報道,10月7日,百度宣布新一輪干部輪崗:即日起,百度集團副總裁、百度集團首席信息官(CIO)李瑩博士擔任小度科技CEO,向集團董事長兼CEO李彥宏直接匯報。據悉,小度原CEO景鯤因個人原因即將辭任。有業內人士認為,此次干部調整,意味著小度科技將承擔百度更多在AI時代的使命,將大模型引入到小度的所有業務,帶來業績增長。
2、雷軍通過小米和順為連番注資百川智能
據量子位10月1日報道,雷軍通過小米集團和順為資本,注資了大模型初創公司百川智能。根據創投圈透露出的消息,雷軍第一次押注這家公司在今年5月,他手下的小米和順為同時參投了百川智能的A1輪,該輪投前估值為數億美元,融資額超過數億人民幣;第二次則是新近百川智能進行的A3輪融資,市場傳言順為、小米再次重金押注,融資額約為數千萬美元。對于上述投融資消息,百川方面表示暫無說明和回應。
3、曝OpenAI擬自研AI芯片 計劃收購公司
據路透社10月6日報道,知情人士透露,OpenAI正在探索自研AI芯片,甚至已經在評估潛在的收購目標。據悉,該公司尚未決定是否繼續推進。不過,據熟悉內情的人士透露,至少從去年開始,該公司就在討論各種方案,以解決其所依賴的昂貴AI芯片短缺的問題。這些方案包括打造自己的AI芯片、與包括英偉達在內的其他芯片制造商更緊密地合作,以及在英偉達之外實現供應商多元化等。對此,OpenAI拒絕發表評論。
4、微軟宣布Bing Chat等免費提供DALL-E 3服務
當地時間10月3日,微軟宣布OpenAI最新的DALL-E 3圖像生成器現在可供所有Bing Chat和Bing Image Creator用戶免費使用。據微軟介紹,DALL-E 3是文本到圖像生成的突破,由深度神經網絡提供支持,可以從自然語言提示生成逼真且多樣化的圖像。
5、微軟發布166頁多模態大模型GPT-4V說明書
據機器之心報道,9月29日,微軟發布針對OpenAI多模態大模型GPT-4V的166頁“說明書”,覆蓋詳細測評和提示詞使用技巧。該報告共分為11個章節,重點是對GPT-4V進行分析,以加深大眾對大型多模態模型的理解。文章用很大篇幅介紹了GPT-4V可以執行的任務,包括用測試樣本來探索GPT-4V的質量和通用性,現階段GPT-4V能夠支持的輸入和工作模式,以及提示模型的有效方法。此前,OpenAI于當地時間25日發布了GPT-4V視覺模型及其系統卡論文,但文檔只有18頁,很多內容都無從得知。
報告地址:
//arxiv.org/pdf/2309.17421.pdf

6、傳微軟將于下月推出首款AI芯片
據外媒The Information報道,知情人士透露,微軟計劃11月14日在其年度開發者大會上推出該公司首款AI芯片,幫助減少對英偉達芯片的依賴。該知情人士稱,微軟仍在考慮是否將該芯片提供給Azure云客戶。微軟、英偉達和OpenAI的發言人未回應置評。據悉,微軟在2019年就開始研發AI芯片,The Information曾于今年4月報道微軟和OpenAI測試一款代號為Athena的AI服務器芯片,但目前尚不清楚下個月推出的芯片正式名稱。
7、研究稱GPT-4審稿意見與人類評審一致性超50%
據新智元報道,10月3日,斯坦福大學等機構的研究者發布論文稱,GPT-4對于Nature、ICLR等頂會的近5000篇論文給出的審稿意見與人類審稿人的意見有超過50%的相似性,且超過82.4%的作者表示,GPT-4給出的意見相當有幫助。論文作者James Zou總結道:我們仍然需要高質量的人工反饋,但LLM可以幫助作者在正式的同行評審之前,改進自己的論文初稿。
論文地址:
//arxiv.org/abs/2310.01783

8、ChatGPT成功預測mRNA疫苗獲諾獎
據新智元報道,10月2日,2023年諾貝爾生理學或醫學獎頒布,獲獎者是Katalin Karikó和Drew Weissman,理由是發現了核苷堿基修飾,從而開發出有效抗新冠病毒的mRNA疫苗,而該結果被ChatGPT準確預測。9月30日,新智元曾報道結合最新的Bing聯網功能,ChatGPT給出了“mRNA疫苗的開發可能會獲得2023年諾貝爾化學獎”的預測。

9、谷歌虛擬助手將集成Bard登陸手機
10月4日,谷歌在Made by Google大會上推出了Bard驅動的個人助理Assistant with Bard,它將Bard的生成和推理能力與Assistant的個性化幫助相結合,用戶可以通過文本、語音或圖像與其互動。谷歌稱將在不久后將其提供給早期測試者,在幾個月內向公眾推出安卓和iOS版本。
10、谷歌AI自主設計芯片論文遭Nature調查
據新智元報道,近日,一篇由谷歌大神Jeff Dean領銜的“AI自主設計芯片”研究,被曝正式接受Nature調查。2021年9月,由Jeff Dean領銜的谷歌大腦團隊發表了一篇AI設計芯片的論文,曾引起業界轟動。然而,隨后有多人發現這項工作并不能被復現,而且關鍵數據和代碼被隱藏了,Nature也對此展開了調查。目前,相關的Nature評論文章前面,已經被貼上了大寫的“Retracted Article”(撤稿)。因為原本的論文受到質疑,因此寫作相關評論文章的作者也將其撤回。
11、DeepMind等發布具身機器人數據集和RT-X模型
當地時間10月4日,谷歌DeepMind與來自33個學術實驗室的學者合作,匯集了來自22種不同機器人類型的數據,創建并發布了Open X-Embodiment數據集和RT-X模型,用于支持具身機器人訓練。研究團隊在五個不同的研究實驗室測試了RT-1-X模型,結果表明,與針對每個機器人獨立開發的方法相比,該模型在五個不同的常用機器人上的成功率平均提高了50%。此外,研究團隊在來自多個實例的數據上訓練視覺語言動作模型RT-2,其在真實世界機器人技能上的表現提高了三倍。
論文地址:
//robotics-transformer-x.github.io/paper.pdf
數據和模型地址:
//robotics-transformer-x.github.io/

12、Meta發布Llama 2 Long,支持3.2萬Tokens
據量子位報道,近日,Meta發布Llama 2 Long,上下文長度達3.2萬Tokens,與GPT-4持平。性能上全面超越Llama 2,在指令微調MMLU(5-shot)等測試集上表現超過ChatGPT,在人類評估上優于10萬Tokens的Claude 2。據介紹,與Llama 2相比,Llama 2 Long的變化主要有兩個方面。一是訓練參數上,采用了高達4000億Tokens的數據源,而Llama 2最多的版本也只有700億。二是架構上,與Llama 2保持不變,但對位置編碼進行了一個非常小的必要修改,以此完成高達3.2億Tokens的上下文窗口支持。
論文地址:
//arxiv.org/pdf/2309.16039.pdf

13、Meta等發布StreamingLLM框架 支持400萬Tokens
據機器之心報道,9月29日,來自MIT、Meta AI、CMU的研究者提出了一種名為“StreamingLLM”的方法,為大語言模型可能遇到的RAM與泛化問題提出了一系列解決方案,號稱能夠“讓語言模型處理無限長度的文本內容”。據介紹,該方法的工作原理是識別并保存模型固有的“注意力池”(Attention Sinks)錨定其推理的初始Token。結合最近Token的滾動緩存,StreamingLLM的推理速度提高了22倍,而不需要犧牲任何的準確性。經研究團隊證實,StreamingLLM能夠讓Llama 2、MPT、Falcon和Pythia可靠地處理高達400萬Tokens的文本,為流式語言模型提供更多部署方面的可能性。
論文地址:
//arxiv.org/pdf/2309.17453.pdf
項目地址:
//github.com/mit-han-lab/streaming-llm

14、傳亞馬遜明年1月將AI集成至電商搜索欄
據外媒Business Insider 10月3日報道,亞馬遜正打造一款AI驅動的聊天機器人,并擬將其整合進亞馬遜網站的搜索欄中,可優化客戶在其電商網站的搜索體驗。該計劃代號為“尼羅河計劃”(Project Nile),將在亞馬遜現有的搜索欄之上添加一層AI,實現即時產品比較、更多詳細信息和評論請求等功能,以及基于搜索上下文和個人購物數據的推薦。知情人士透露,該功能正在進行內部測試,最快可能在明年1月推出。
15、Stability AI發布面向移動設備的Stable LM 3B
當地時間10月2日,AIGC獨角獸Stability AI宣布推出Stable LM 3B實驗版本,這是一款專為便攜移動設備設計的緊湊型語言模型,包含30億個參數,使用256個英偉達A100 40GB GPU訓練而成,主打文本生成。據介紹,與上一次發布的Stable LM相似,Stable LM 3B的主要優勢之一是體積更小、效率更高。此外,它的性能超過了目前最先進的3B參數語言模型,甚至超過了一些7B參數規模的最佳開源語言模型。
16、三星Exynos 2400芯片亮相 AI處理快14.7倍
據IT之家報道,10月6日,三星在System LSI Tech Day 2023活動上預覽了最新的Exynos 2400處理器。據介紹,Exynos 2400的CPU性能比Exynos 2200快70%,AI處理速度快14.7倍,特別針對智能手機設計優化了AI性能,借助芯片能力,可以在本地實現文本生成圖片的能力。
17、AI創企Jasper CEO辭職,Dropbox前總裁接任
據外媒Gold Penguin報道,近日,AIGC獨角獸Jasper CEO Dave Rogenmoser辭去CEO職位,移交給網盤公司Dropbox前總裁Timothy Young。10月18日,該公司計劃在Young和Rogenmoser共同主持的在線活動中發布主要產品公告。
18、CAIS等機構學者提出可檢測LLM撒謊的內部表征
據新智元報道,10月3日,來自CAIS、CMU、伯克利、斯坦福、康奈爾、馬里蘭、賓大等機構的學者發布論文,提出在大語言模型內部具有可解釋的內部表征,人類可以控制這些表征來影響大模型的幻覺、偏見、危害,甚至可以檢測出它們是否在撒謊。
研究者們設計了一種類似于PET和fMRI等腦部掃描的,稱為LAT的掃描技術,來觀察大模型參與真理等概念或撒謊行為時的大腦活動,隨后發現大模型具有一致的內部信念。通過檢查它們在TruthfulQA上的內部真理概念,研究者發現,更大的模型具有更準確的信念。在表達真實信念時,大模型會表現出不同的大腦活動,而在撒謊時卻并不會這樣。因此,研究人員可以通過刺激負責誠實行為的大腦區域,抑制不誠實行為的區域,以無監督的方式大幅改善TQA上的SoTA,讓大模型變得更“誠實”。
論文地址:
//arxiv.org/pdf/2310.01405.pdf

19、商湯科技49篇論文入選ICCV 2023
10月2日至6日,國際人工智能頂級國際會議ICCV(International Conference on Computer Vision)在法國巴黎舉行。本屆ICCV投稿總數達8068篇,其中2160篇被接收,錄用率為26.8%,略高于上一屆ICCV 2021錄用率25.9%。商湯科技及聯合實驗室共49篇論文入選ICCV 2023,涵蓋文生圖、3D數字人、自動駕駛、目標檢測、視頻分割等多個與大模型和生成式AI相關的熱點方向。