1、阿里云通義千問140億參數Qwen-14B發布
2、百川智能發布Baichuan2-53B閉源大模型
3、Meta或于本周發布系列AI聊天機器人
4、開源可商用的中文版Llama 2發布
5、特斯拉機器人啟用端到端神經網絡
6、6.7k Star量的vLLM出論文 助大模型低成本部署
7、亞馬遜與Anthropic達成合作 至多投資40億美元
8、恒生電子大模型LightGPT開啟內測
9、AI原生人力資源服務商TTC獲千萬人民幣融資
10、Canalys:2027年兼容AI功能的個人電腦占60%
1、阿里云通義千問140億參數Qwen-14B發布
今天,阿里云舉辦通義千問開源發布會,正式發布通義千問140億參數模型Qwen-14B及對話模型Qwen-14B-Chat,開源、免費。據介紹,Qwen-14B在眾多同尺寸20B以內開源模型中突出重圍,在MMLU、C-Eval、GSM8K、MATH、GaoKao-Bench等12個權威測評集上都取得了最優成績,超越所有測評中的SOTA大模型。此外,通義千問團隊還升級了Qwen模型對接外部系統的能力,開發者可以通過簡單的操作實現復雜的插件調用,也可以基于Qwen系列基座模型快速開發Agent等AI系統,利用Qwen的理解和規劃能力完成復雜的任務。同時,Qwen-7B也實現了全面升級,核心指標最高提升22.5%。
2、百川智能發布Baichuan2-53B閉源大模型
今天,百川智能發布Baichuan2-53B閉源大模型,全面升級了Baichuan1-53B的各項能力。據介紹,Baichuan2-53B的數學和邏輯推理能力顯著提升,并通過高質量數據體系和搜索增強大幅降低了模型幻覺,是目前國內幻覺問題最低的大模型。百川智能此次還開放了Baichuan2-53B API接口,宣布正式進軍To B領域。
API接口文檔地址:
//platform.baichuan-ai.com
3、Meta或于本周發布系列AI聊天機器人
據《華爾街日報》報道,知情人士透露,Meta計劃最快于本周在其社交媒體應用上發布一系列AI聊天機器人,以吸引年輕用戶。據稱,這些聊天機器人在公司內部被稱為“Gen AI Personas”,正在由員工進行內測,預計將在當地時間本周三開始的Meta Connect大會上推出。據《華爾街日報》看到的內部文件顯示,正在開發的聊天機器人中有一款被稱為“機器人Bob”,自稱是一位“高智商、敏銳的智慧和尖銳的諷刺”的將軍;一個名為“Alvin the Alien”的聊天機器人會詢問用戶的生活;一個名為“Gavin”的聊天機器人發表了攻擊性言論,以及批評扎克伯格和Meta但贊揚TikTok和Snapchat的評論。
4、開源可商用的中文版Llama 2發布
據量子位報道,現在,15小時、幾千塊錢、85億Tokens數據,即可訓練出中文版Llama 2。Colossal-LLaMA-2近期把大模型門檻打下來了,同時開源團隊還提供了一個完整的評估體系框架ColossalEval,以實現低成本的可復現性。這一模型綜合性能達到開源社區同規模從頭預訓練SOTA模型水平。方案完全開源,包括全套訓練流程、代碼及權重;而且無商業限制,還可遷移應用到任意垂類領域和從頭預訓練大模型的低成本構建。
GitHub地址:
//github.com/hpcaitech/ColossalAI
5、特斯拉機器人啟用端到端神經網絡
據量子位報道,當地時間9月24日,特斯拉人形機器人「擎天柱」最新視頻公開,啟用了自動駕駛系統同款的端到端神經網絡架構,無需任何規則代碼就學會分揀物品。對此網友表示很難相信視頻是真的,馬斯克回復稱:“執行器、傳感器和整體機械結構更多升級還在后面。”伴隨視頻發布的是機器人團隊招聘公告,特斯拉機器人團隊招聘各類硬件工程師及機器學習工程師、實習生,總計51個職位。
6、6.7k Star量的vLLM出論文 助大模型低成本部署
據機器之心報道,今年六月,來自加州大學伯克利分校等機構的一個研究團隊開源了vLLM,其使用了一種新設計的注意力算法PagedAttention,可讓服務提供商輕松、快速且低成本地發布LLM服務,該團隊宣稱vLLM能實現比HuggingFace Transformers高24倍的吞吐量。現在離vLLM最初宣布時差不多已過去三個月,他們終于發布了這篇關于vLLM和PagedAttention的研究論文,其中詳細解釋了他們如何通過類似操作系統虛擬內存管理的機制來實現高效的LLM服務。該論文已被將于十月底在德國舉辦的ACM操作系統原理研討會(SOSP 2023)接收。
論文地址:
//arxiv.org/abs/2309.06180
代碼地址:
//github.com/vllm-project/vllm
文檔地址:
//vllm.readthedocs.io/
7、亞馬遜與Anthropic達成合作 至多投資40億美元
據界面報道,亞馬遜與人工智能公司Anthropic今日宣布達成戰略合作,共同推進生成式AI發展。Anthropic選擇亞馬遜云科技(AWS)作為其主要云提供商,并將利用AWS的高性能、低成本機器學習加速器,在AWS Trainium和Inferentia芯片上訓練和部署其未來基礎模型。亞馬遜將向Anthropic投資至多40億美元,并擁有該公司的少數股權。
8、恒生電子大模型LightGPT開啟內測
今日,恒生大模型產品已面向20家金融機構開啟內測。據悉,恒生金融行業大模型LightGPT是專為金融領域打造的大語言模型,它通過訓練海量金融數據,對金融相關問題有更好的理解能力。光子是基于LightGPT的智能應用服務,可以為金融機構的各個業務系統注入AI能力,包括投資合規、投顧、客服、運營、投研和交易等。
體驗地址:
www.hs.net/lightgpt
9、AI原生人力資源服務商TTC獲千萬人民幣融資
《科創板日報》25日訊,近日,AI原生國際性人力資源服務提供商TTC完成數千萬元人民幣Pre-A輪融資,本輪融資領投方為創新工場。
10、Canalys:2027年兼容AI功能的個人電腦占60%
據知名行研機構Canalys預測,兼容AI個人電腦將呈穩定的上升趨勢。截至2023年第二季度,在蘋果的神經引擎的大力推動下,兼容AI個人電腦市場實現了超過500萬臺的出貨量。隨著x86架構提升它們的AI能力,預測從2024上半年開始將出現新一輪的AI賦能模型浪潮。到2024年第四季度,出貨量預計上升至約2000萬臺的水平,在全球個人電腦出貨量的占比超過25%。
鑒于在2024年末推出的最新Windows操作系統將預期發布經AI提升的功能,以及AI工具在商業和生產力軟件的廣泛應用,兼容AI個人電腦市場將在2025年和2026年有望實現爆發式增長。到2027年,出貨量預計超過1.75億臺,在總個人電腦出貨量的占比超逾60%。從現在起到那時,該板塊的復合年均增長率將達94%。