对AI的恐惧被夸大了！“强化学习之父”萨顿外滩演讲：四条原则预言AI未来

智東西（公眾號：zhidxcom）
作者 | ZeR0
編輯 | 漠影

智東西9月11日報道，今日上午，在2025 Inclusion·外灘大會開幕式上，2024年圖靈獎得主、“強化學習之父”理查德·薩頓（Richard Sutton）發表主旨演講。他認為，人類數據紅利正逼近極限，人工智能（AI）正在進入以持續學習為核心的“經驗時代”，潛力將遠超以往。

知識來自于經驗，可以從經驗中學習。一個智能體的智能程度，取決于它能預測并控制自身輸入信號的程度。經驗是一切智能的核心與基礎。

強化學習帶領我們進入了新的經驗時代，但要釋放全部潛力，還需要兩項目前尚不成熟的技術——持續學習（continual learning）和元學習（meta-learning）技術。

面對外界對AI帶來偏見、失業甚至人類滅絕的擔憂，薩頓認為，這種對AI的恐懼被夸大了，并且是被某些從中獲利的組織和個人煽動起來的。

“人類最卓越的超能力，就在于比其他任何動物都更擅長協作。”在薩頓看來，AI和人類繁榮將來自于去中心化協作。目標不同的智能體，可以通過去中心化的協作實現雙贏。

他預測當今人類的智力水平，很快將會被超級人工智能，或者超級智能增強的人類遠遠超越，權力和資源會流向最聰明的智能體。

在人類的發展進程中，AI的替代將是不可避免的。

薩頓認為，人類的獨特之處在于“把設計推向極致”，創造出能自己設計的事物，這也正是今天通過AI所追求的目標。

人類至少是催化劑，是助產士，更是開啟宇宙第四大時代——“設計時代”的先驅。

“AI是宇宙演化的必然下一步，我們應以勇氣、自豪和冒險精神來迎接它。”薩頓說。

以下是理查德·薩頓演講全文：

很高興在2025年外灘大會上發言，我的主題是人工智能。

在接下來的發言中，我將圍繞這個主題談三個方面：我想談談科學發展趨勢，政治影響，以及哲學意義。

一、數據紅利逼近極限，AI進入“經驗時代”

我們處在“人類數據時代”。AI被訓練來預測人類的語言和標簽，并由人類專家不斷微調。

今天大多數機器學習的目的，是把人類已有的知識轉移到一個靜態、沒有自主學習能力的AI上。

但是，我們逐漸開始達到人類數據的極限，我們開始意識到，這種方法通常無法生成新的知識，它并不適合持續學習，它不能持續不斷地學習，而持續學習對智能的效用至關重要。

播客主持人Dwarkesh Patel意識到了這一點。他在播客中說：“但根本問題在于，大語言模型并不會隨時間推移而變得更聰明，這和人類不一樣。這種缺乏持續學習能力的情況，是一個非常非常大的瓶頸。在很多任務上，大模型的基準表現可能優于人類的平均水平，但我們沒辦法給模型提供高層次的反饋，只能接受它本身自帶的能力，只能不斷折騰調整提示詞，但在實踐中，這根本達不到人類那種學習和進步的程度。人類真正的優勢，并不在于單純的智力極限，而在于他們能夠不斷積累上下文，反思失敗，并在實踐中一點點改進、提升效率。”

關于“智能”的根本科學爭議是，它究竟是大量知識的積累，還是快速學習的能力。

當然，智能只是一個詞，我們可以按自己的意愿使用它，但我們應該清楚它歷來是如何被使用的。

我們看看傳統的智力測量方法，也就是“智商”，或者IQ，它等于你掌握的知識量除以你所積累的經驗。所以，在我看來這個定義正是在衡量學習的速度，學習速度，是常識所理解的“智力”的關鍵。

現在我們正進入“經驗時代”，我們需要一種新的數據源，它隨著智能體的變強大而不斷增長和完善，就像電腦游戲中的自我博弈一樣。

這類數據也可以不依賴自我博弈，而是由智能體以第一人稱與世界互動直接生成，我稱之為“經驗”。這正是人類和其他動物的學習方式，也是 AlphaGo 創造第“37 步”的方式，也是AlphaProof近期在國際數學奧林匹克中獲得了銀牌的方式。

觀察嬰兒與各種玩具玩耍的視頻，我們會看到他所獲取的數據，取決于他自己的一舉一動。孩子和這個玩具玩一段時間，然后轉向下一件玩具，所以他獲得的數據由他的行為決定。關鍵在于，我們需要與智能體的智力水平和認知發展相匹配的數據，這正是可以從自身經驗里得到的東西。

關于經驗思維模式，是智能體與世界交換信號，這些信號構成了它的“經驗”。

我這里說的“經驗”，并不是含糊的概念，而是指這三項很具體的要素：觀察、行動和獎勵。這三種信號在智能體與世界之間來回傳遞，這就是我定義的“經驗”——這是生命的數據。

所以我很篤定認為，知識來自于經驗，因此可以從經驗中學習。一個智能體的智能程度，取決于它能預測并控制自身輸入信號的程度，特別是獎勵信號。經驗是一切智能的核心與基礎，這就是基于經驗的思維方式。強化學習領域正是基于這種思維方式。

總而言之，在人工智能未來的科學趨勢上，未來如果能創造出超級智能體和由超級智能增強的人類，將為世界帶來純粹的福祉。

完全智能的智能體必須從經驗中學習，這超出了大型語言模型的范疇，令人驚嘆且實用，將作為世界知識的可定制接口。

我們已經使用強化學習進入了新的經驗時代，但要釋放經驗的全部潛力，還需要我們現在還不具備的持續學習和元學習技術。

二、AI已經被高度政治化，對AI的恐懼被夸大

現在，我想對AI的政治影響談一點看法。

首先要指出的是，今天AI已經成為高度政治化的議題。AI是國家地緣政治競爭的焦點，公眾也感到恐懼。除地緣政治之外，公眾擔心AI會帶來偏見、失業甚至導致人類滅絕。

一些國家正在陸續立法，限制AI模型的能力，更有人呼吁暫停AI研究，將其與核武器和生物武器相提并論。

總而言之，對人工智能的規制、管控和對齊的呼聲此起彼伏，這就是現實：AI已經被高度政治化。

我的觀點是，這種對AI的恐懼被夸大了，并且是被某些從中獲利的組織和個人煽動起來的。

但實際上，這些問題在人類幾千年來一直在應對的挑戰并無不同。

讓我們提出一個問題，在一個由智能體構成的社會里，類似人類社會，在一個人工智能社會，“目標是唯一的，還是多元的？”

在強化學習中，我認為這是明確的，每個智能體都有自己的目標，也有自己的獎勵。同樣，在自然界中，每只動物都有它自己的痛苦和快樂。

回看我們的經濟，只有當每個人有不同的目標和能力，經濟才能運行得最好。經濟并不真正依賴于人們擁有共同目標，盡管我們常把這類說法掛在嘴邊。

只要我們審視現實世界、經濟和社會，我們可以說智能體也能夠共存，不同的智能體可以和平共處，即便它們的目標不同，我們并不需要所有人都對齊同一個目標。

為了進一步展開，我需要多說明幾句。

我們需要定義兩個詞：“去中心化”的定義是每個智能體追求自己的目標，這正是我們經濟體系的運行方式；“協作”，就是目標不同的智能體，通過互動實現雙贏。

我認為，協作就是我們的偉大超能力，人類最卓越的超能力就在于我們比其他任何動物都更擅長協作。

協作之所以能實現，在于語言和貨幣——這兩樣都是人類獨有的。

人類最偉大的成功在于協作本身：經濟、市場與政府。

人類的重大失敗正是協作失敗：戰爭、偷竊與腐敗。

“去中心化協作”是“共同目標”的替代方案，在我看來，“去中心化協作”更優雅，它更可持續、更強韌、更靈活，適應性更強，它并不需要控制人們的目標。

正如我所說，人類比其他任何動物都擅長協作，但我們仍然做得遠遠不夠。我們仍然有戰爭、盜竊，我們仍然有腐敗、欺詐。協作之路依然很艱難，協作并非總能達成，至少需要兩個代理人互相信任。一旦協作缺失，總有人能從中獲利：軍火商、獨裁者、騙子、盜賊。

因此，協作必須依靠制度：既要促進協作，還要懲治騙子、欺詐者和勒索者。中心化的機構能幫助協作實現，他們可以懲罰盜賊和作弊者，但如果中心化機構走向僵化，長遠來看也會阻礙協作。

放眼當下，有很多呼聲希望對AI進行中心化控制：對齊AI的目標，暫停甚至終止AI研究，限制可投入的算力，限制AI行業的競爭程度，或借此確保AI的安全。這些主張如出一轍，根源都是恐懼，說到底，這都是基于“我們對他們”的思維，認為他人不可信任，妖魔化對方。

所以我認為這不過是人類的一種天然傾向，我們必須清醒地認識到，這種傾向也在向AI領域蔓延。

因此，關于AI的政治議題，我的核心結論是：AI和人類繁榮都來自于去中心化協作。

協作并非總能實現，卻是世間一切美好的事物的源泉，我們必須尋求協作、支持協作，并致力將協作制度化。

此外，只要我們用自己的眼睛觀察，就能輕易看出誰在鼓吹不信任，誰在呼吁非協作和中心化控制，我們都應該努力抵制這些呼聲。

這是一個有用的視角，來審視所有關于人類與AI互動的呼吁。

三、四條原則預測AI未來，人類現有智能將被大幅超越

最后，我想談談AI與哲學。

我認為，AI是人類最古老的追求之一，它并不是陌生的外來技術，而是與人類的本性高度相似。

數千年來，哲學家和普通人都在努力理解自己，一直對內在的運作機制充滿好奇：我們的心智是如何運作的？又該如何讓它運作得更好？這不是自戀，而是一場宏大的求索。

智能是宇宙中最偉大的力量之一，如果能理解它，人類就會變得更強大、更有能力。

理解智能，是科學與人文學科共同追尋的圣杯，它是一個偉大而榮耀的獎賞。

然而，我們依然心懷恐懼和憂慮。

那么，讓我們暫且擱置“想要或不想要什么”的擔憂，讓我們盡量以最現實的方式來去預測、去展望。

所以，我提出四條原則，來現實地預測對AI的未來：

第一，對世界應該如何運轉，全球并沒有統一的意見，沒有哪一種看法能夠凌駕于所有其他觀點之上。

第二，總有一天，人類將真正理解智能，并借助技術將其創造出來——我們一定能做到。

第三，這個過程不會止步于當今人類的智能水平，很快，它將會被遠遠超越，無論是超級人工智能，還是增強的人類，都將遠遠超越這一水平，但無論如何，當前人類現有的智能將被大幅超越。

第四條原則：隨著時間的推移，權力和資源必然會流向最聰明的智能體。

所以，這必然把我們帶到這樣一個結論：在人類的發展進程中，AI的替代是不可避免的。

但這本身仍是一種自我中心，以人類為中心的視角。

如果從宇宙的視角來看，這一切又是怎樣的呢？

我傾向把宇宙歷史劃分為四個時代：粒子時代、恒星時代，接下來進入我們通常稱為“生命時代”，但我更愿意稱為“復制者時代”，因為在今天看來，生命幾乎就是一臺機器——一臺生物機器。

在第四個時代——機器與設計時代——這些被設計出來的機器正越來越像生命。所以，我更愿意稱它為“復制者時代”，因為如今的生物系統，本質上就是能夠自我復制、不斷繁衍自身的體系。

我們正走向這樣一個時代：周圍越來越多的事物，都是由人類設計的。

所謂“設計”，指的是它們最初僅存在于某個設計者的頭腦中——可能是人，也可能是一臺機器——然后才被創造出來。

環顧你所在的房間，幾乎所有東西都是設計的產物：建筑是設計出來的，椅子是設計出來的，屏幕是設計出來的，唯一沒有經過設計的，當然是人類，我們是復制的產物。經過設計的事物越來越多，正在占據主導地位。

現在我們可以直接進入一個問題：我們的角色是什么？人類是什么？人類在宇宙中的角色是什么？我們能否冷靜，并且不傲慢地回答這個問題？我們都感到人類是特別的，并不只是另一種復制品，那么究竟特殊在哪里？

我認為人類的獨特之處在于：作為復制者，我們將設計提升到了前所未有的高度。

將設計推向極致意味著什么？推向極限，能走多遠？我覺得答案其實很明確，至少在可預見的將來，把設計推向極致，就是創造出能自己進行設計的事物。這正是我們今天通過人工智能所追求的目標。

所以，我將這一點作為我對“人類是什么”的答案：人類至少是催化劑，是助產士，更是開啟宇宙第四大時代——“設計時代”的先驅。

結語：我們應以勇氣、自豪和冒險精神來迎接AI

這就是我今天分享的三點：

在科技趨勢上，2020年代的AI，也就是人類數據時代，有卓越的表現。但我相信，我們正在進入一個全新的 “經驗時代”，潛力將遠超以往，因為它可以通過經驗不斷學習新知識。

關于AI的政治議題，我認為，AI的政治議題，是人類的映射。

最后，在哲學層面，我認為，AI是宇宙演化的必然下一步，我們應以勇氣、自豪和冒險精神來迎接它。

非常感謝大家的聆聽。

国产又黄又猛又粗又爽的A片,小祖宗┅┅快┅┅用力啊视频,国产精品麻豆欧美日韩ww,少妇精品无码一区二区免费视频,波多野结衣在线播放

一、數據紅利逼近極限，AI進入“經驗時代”

二、AI已經被高度政治化，對AI的恐懼被夸大

三、四條原則預測AI未來，人類現有智能將被大幅超越

結語：我們應以勇氣、自豪和冒險精神來迎接AI

相關推薦