智東西(公眾號:zhidxcom)
編譯 |? 陳駿達
編輯 |? Panken

智東西9月8日消息,近日,硅谷知名孵化器YCombinator發布了對Anysphere聯合創始人兼CEO Michael Truell的深度訪談。Anysphere是爆火AI編程工具Cursor背后的公司,估值已達99億美元(約合人民幣707億元)。訪談中,這位年僅25歲、卻擁有十余年開發經驗的00后創業者,完整回顧了打造Cursor過程中經歷的彎路與困境,并分享了從中汲取的寶貴經驗。

Anysphere成立于2022年,一開始曾探索AI CAD、加密通信軟件等項目,但由于缺乏相關背景、變現困難等原因,最終選擇了AI編程賽道。

彼時,AI編程賽道的商業價值已經被Github Copilot驗證,同時競爭相對激烈,但Anysphere找到了一個切入點:市面上雖有不錯的AI編程產品,但沒有產品是完全自動化、完全變革軟件開發流程為目標的。

從寫第一行代碼到公開發布,Anysphere的創始團隊歷時3個月,打造了初版Cursor。2023年發布后,Cursor在產品功能上不斷嘗試與摸索,Truell形象地稱其為“在沙漠中探索”。

當時,部分用戶希望Cursor轉型為低代碼工具,或是適配特定的技術棧,但Anysphere堅持了Cursor的原有定位,專注于打造通用AI編程體驗。

Anysphere曾在Cursor上走了不少彎路。例如,他們一開始想從零開始打造IDE本身,后來才意識到應將精力集中在核心AI功能的開發,而非在IDE界面上與VS Code這樣有十幾年歷史的產品直接競爭。

此外,Anysphere起初抱著“不重復造輪子”的心態,決定不做模型。但隨著產品迭代和用戶規模的擴大,他們發現自研模型已經成為關鍵杠桿,不僅能利用數據持續優化用戶體驗,更是一項“核心且必須建設的能力”。

通過不斷提升產品對代碼庫的理解與預測能力,Cursor逐漸贏得用戶口碑,實現爆發式增長——2023年ARR(年化收入)突破100萬美元,2024年更是實現1億美元ARR的重大跨越。

在訪談中,Truell還回顧了他在高中階段就與AI技術結緣的往事,并給在校的青年創業者提供了幾則創業建議。對AI編程的未來,他給出了如下判斷:AI將成為工程師的“同事”,在輔助開發的同時,并不會削弱編程作為通識教育和實用技能的重要性。

以下為Michael Truell今年6月在YC AI創業學校的完整訪談整理稿:

一、高中開啟創業生涯,16歲編寫神經網絡

主持人:那我們先從你的創業起點聊起吧。故事可以追溯到你中學時期,那時你開始讀PG(Paul Graham,孵化器YCombinator創始人)的文章,對嗎?

Michael Truell:是的,我很早就對創業感興趣,也對很多其他事情感興趣。我一開始接觸編程,就是因為想做一些商業化的東西。

我第一次看到代碼,是在一個寒假。我和哥哥想做一款爆火的手機游戲,但完全不知道怎么開始。于是我們上谷歌搜索“如何做游戲”,發現需要下載一個叫Xcode的軟件。

我們下載后,屏幕上出現了一堆五顏六色的奇怪符號,那是Objective-C語言。當時它還挺流行的,不過現在受歡迎程度已經沒那么高了。

我哥哥看到那一堆幾乎無法理解的Objective-C代碼后,立刻放棄了,從此沒有再碰編程。他現在走的是完全不同的道路,比如在嘗試畫畫之類的。而我則堅持下來了,買了本Objective-C的書,慢慢開始做手機游戲。這就是我進入編程的起點。

一路走來,我是PG的文章和Sam Altman(OpenAI聯合創始人兼CEO,前YC總裁)的文章的忠實讀者,也讀了YC里很多人的文章。這些在我高中早期就給了我很大的啟發。

主持人:最令人驚訝的是,你現在才24歲(截至發稿時,Michael Truell已25歲),就在很短時間里把Cursor打造成一家巨大的公司。很多人可能會覺得你是突然冒出來的,但實際上你已經積累了十多年的經驗,不斷做項目、不斷發布成果。而且你在高中就已經開始接觸AI了,對吧?能不能聊聊當時的項目,以及你是怎么入門的?

Michael Truell:我算是很幸運,既早早接觸到編程,又很早就對AI感興趣,還遇到了幾個很棒的合作者,一起做AI項目。

我其實并不算很擅長做手機游戲,但其中有一個小項目卻意外地火了——一個能偽造游戲高分的手機應用,可以在“鋼琴塊”或者“Flappy Bird”里生成假的高分,然后發給朋友。這是最簡單的東西,不涉及很復雜的編程,反而成了最受歡迎的。

之后,我和朋友開始對“機器狗”這個想法很著迷。我們覺得,如果能有一只機器狗,不用編程,就能通過正反饋和負反饋來學習,那該多酷啊。

比如,做對了給它點獎勵,做錯了就說“不好”。這樣就能教它撿球之類的技能。我們完全不知道怎么實現,于是開始搜索,鉆進了很多技術的“兔子洞”。

那讓我們接觸到了遺傳算法,后來又了解到神經網絡。那時候已經有人在嘗試用遺傳算法來進化神經網絡,比如NEAT這樣的研究。之后,我們又接觸到了強化學習,早在2015年,就已經有人在長期研究強化學習了。

最終,我和我的朋友確實造出了一些機器人,但沒有留下什么特別重大、有長久影響力的成果。

不過,我們做了一些有趣的探索,比如讓強化學習算法更高效,提升數據效率,讓算法能從極少的數據中學習,比如幾十個數據點。或是讓算法能夠從帶有噪聲的數據中學習。

我們雖然沒有造出機器狗,但做了一個多軸的機械臂,可以握著拍子,打乒乓球。通過安裝合適的傳感器,以及提供正確的反饋,它能學會在看到球時揮動機械臂。

我們還打造了一款KiwiDrive機器人,我們教會了它如何循線。

這其實是很好的機器學習入門教育。因為我們當時太天真,甚至不知道有Torch、TensorFlow這樣的工具。

主持人:于是你從零開始寫了自己的神經網絡,大概16、17歲?

Michael Truell:因為是做機器人,硬件用的是微控制器,內存特別小,裝不下現成的機器學習庫。于是我們硬著頭皮自己寫了一個簡化版的神經網絡庫。

雖然完全不懂里面的數學,比如微積分,但還是磕磕碰碰地實現了一些關鍵想法。這過程中學到了很多東西,雖然基礎知識有不少漏洞,后來花了很多年才補上。

二、早期探索多個項目,曾打造CAD版Cursor

主持人:然后就是AnySphere的創立,對吧?當時你們剛從MIT畢業,那是2022年,你們最初的想法是什么?

Michael Truell:Cursor的起點其實是在2021年。我和聯合創始人們都對AI很感興趣,每個人都有類似打造“機器狗”的經歷。

比如有一個聯合創始人試著用大模型打造谷歌的競品,還有人做過計算機視覺研究的學術研究,也有人在谷歌這樣的公司做推薦系統。

我們都對AI很感興趣,到2021年,我們開始思考,接下來要做什么?是進學術界、加入大公司、還是自己創業?

讓我們興奮的有兩個契機:一是開始看到第一個AI產品落地,比如GitHub Copilot;二是看到一些研究顯示,AI的能力會隨著模型規模的增長而持續提升。于是2022年初,我們搞了一個月的黑客馬拉松,嘗試在某個知識工作領域里,用逐漸成熟的AI技術打造這一行業未來的模樣。

主持人:你們為第一個項目收集了很多數據對吧?

Michael Truell:沒錯。我們最早的方向是機械工程,給機械工程師做一個Copilot,能預測他們在CAD軟件(像SOLIDWORKS或Fusion 360)里的操作。我們選這個方向,是覺得市場冷門、沒什么競爭。但事實證明這是個糟糕的選擇,因為我們誰都不是機械工程師,而且當時的底層技術也還沒那么成熟。

主持人:你們堅持了好幾個月,花了大量精力抓CAD文件,還做出了自動補全的功能?

Michael Truell:說實話,當時大部分精力都花在數據抓取上。我試著把互聯網上所有的CAD模型都收集起來。另外還有各種不同的文件格式,需要把它們統一轉換成一個標準格式。

CAD這個軟件市場很奇怪,有很多不同的系統,各自都挺流行,但整體非常分散。還有一些云端CAD系統,它們沒有便捷的導出方式,也不希望別人抓取它們的數據。所以我們在這方面花了很多力氣。

另外,那個時候用于訓練模型的基礎設施還很原始,所以在底層系統上也花了很多功夫,還不斷試驗模型。我們甚至嘗試給這些CAD系統“硬加”插件,因為我們做的其實是一個插件。但這些應用本身幾乎不支持插件,所以挺折騰的。

當時我們還同時在做別的項目。我的兩個聯合創始人開發了一個端到端加密的消息系統,因為其中一位有安全研究的背景。

他們的想法是,像Signal和WhatsApp這樣的應用雖然會加密消息內容,但并不會隱藏“誰在什么時候和誰聊天”。而這其實是非常關鍵的信息,如果你不想完全信任消息應用的提供方,這點就很重要。

主持人:那大概是在2022年中期?你們大概花了6個月做這些想法,那當時有多少用戶呢?產品有上線嗎?

Michael Truell:這些項目基本都沒什么用戶。

主持人:你們是在什么時候意識到,這些想法行不通呢?就是說,大家都在拼命做,但最后發現創業并沒有走通。那個時刻是什么感覺?

Michael Truell:不同項目的情況有點差別。比如消息系統,技術上非常厲害,但在可擴展性上有很大問題。他們試著交給用戶使用,發現不行;后來又嘗試B2B授權,但還是行不通。大概折騰了幾個月,始終沒能獲得關注。

至于CAD項目,我們也是花了很多個月,想讓模型真的對終端用戶有用。但到最后,我們也不得不思考:我們自己是不是對這些方向真的感興趣?

三、受GitHub Copilot啟發,3個月造出初代Cursor

主持人:所以你們在轉到代碼補全之前,已經嘗試過三四個想法?

Michael Truell:是的。其實我們很早就受Copilot的啟發,只是覺得AI編程競爭太激烈了,就繞開了。現在的競爭也很激烈。

主持人:當時GitHub Copilot在2022年已經有大約1億美元的收入,甚至可能更多。很多人覺得游戲已經結束了:GitHub已經做到了。你們當時真的覺得自己能比Copilot做得更好嗎?

Michael Truell:一開始我們并沒有這樣想。當時我們都有點絕望了,因為前面的項目都不順利,我們對那些方向也漸漸提不起興致,就在不斷試錯和反思中意識到:其實我們真正讓我們興奮的,是編程的未來。

我們也看到了整個行業在技術和產品上的趨勢:如果真的沿著這條路走下去,未來五年,編程方式一定會被徹底改變,所有軟件開發都會通過模型來完成。

但當時還沒有多少人把這件事當真。大家都在做很棒的產品,也在慢慢改進,但沒有人真正去設想一個完全自動化、完全不同的軟件開發流程。于是我們決定全力以赴。

主持人:這其實挺大膽的,因為你們決定放棄那些自己經驗不足的方向,轉而面對一個巨頭——GitHub Copilot。

Michael Truell:其實當時并沒有覺得大膽。畢竟我們只是幾個人坐在客廳里,拿著筆記本電腦寫代碼,又不是一個大公司轉型。

剛開始我們還想著做一些小而專的工具,比如自動檢測代碼里的潛在漏洞,或者只針對某些細分領域(比如量化研究)做產品。但在探索過程中,我們腦海里不斷冒出各種點子,去想Cursor如果真的要成為“最好的通用AI編程方式”,會是什么樣子。我們對這個方向有很強的信念和興奮感,所以最后就決定沖了。

主持人:那是在2022年底,對嗎?你們多快就發布了第一個產品?它當時是什么樣子?

Michael Truell:從寫第一行代碼到公開發布,大約花了3個月。最初我們是從零搭了一個編輯器,當然用了很多開源組件,比如CodeMirror和語言服務器,但整體是自己拼起來的。

我們還寫了遠程SSH功能、Copilot集成(因為我們沒有自動補全功能)、語言服務器的集成,在像代碼編輯器市場這樣成熟的領域里,要下很大功夫,才能做出一個真正有競爭力、能夠成為用戶日常使用工具的產品。

大概四周后,我們做出了第一個我們自己能當作日常開發工具的版本,再過四周,就讓第一批測試用戶用了,又過四周,就對外開放了。那時的產品還很粗糙,但我們覺得,反正就先讓大家試用。

四、從挑戰VS Code到專注AI功能,自研模型是Cursor核心能力

主持人:你們自己從零開始寫了一個編輯器,這過程學到了什么?

Michael Truell:是的,我們當時充滿了敬畏之情。有一段時間,人們并不喜歡我們的產品。所以我們全力以赴,非常專注。在這一過程中,我們學到了如何打造最初的AI功能。

剛開始的時候,只有一個控制臺,它會在編輯器里調出一個萬能遙控器,然后你向它發出指令。AI會自主判斷用戶意圖,比如是想要聊天,還是需要一個可采用的代碼建議,或者是在你的代碼庫里搜索并回答一個問題,又或是長時間運行還是短時間運行?當時用戶并沒有太多的控制權。

我們學到的是,鑒于2022年底當時的技術水平,產品的形態必須有所不同。我們積累了第一批早期的AI功能,這些功能成為了Cursor的核心部分,后來我們自己不斷迭代,用戶也提供了反饋。

學到的另一則教訓是,當時我們曾試圖快速開發功能齊全的理想代碼編輯器,并加入自認為出色的AI功能。原以為花上幾個月就能構建一個成熟編輯器,和VS Code功能基本接近,但VS Code經過12年開發,是最早的TypeScript項目之一,也擁有眾多開發者。

我們很快意識到這一想法并不現實,應該專注于AI功能。我們后來轉向了基于VS Code的開發,就像瀏覽器通常基于Chromium的渲染引擎一樣。

主持人:另一件事是,你們也做了自己的模型。那時候,你們從Codex獲得了很多靈感,對吧?

Michael Truell:我們著手推進第一個重要項目——即利用AI提升機械工程師的生產力時,啟動階段就需要資金用于模型訓練,因為當時市面上的模型在該任務上表現不足。

最初我們經常引用Codex的論文,也就是GitHub Copilot所使用的首個自動補全模型。根據我們的估算,即便在2022年模型訓練成本普遍被認為很高的情況下,Codex的訓練花費并不算大,可能僅在10萬美元左右。

在機械工程領域的嘗試中,我們自主進行了模型訓練。但這段經歷也讓我們在啟動Cursor時更加謹慎,希望盡可能務實、避免重復造輪子,因此初期完全未涉足模型訓練。

然而,隨著2023年產品不斷迭代,我們逐漸意識到自主訓練模型已成為一個關鍵的產品杠桿——尤其是在用戶規模顯著擴大之后。它不僅幫助我們更好地響應用戶需求,也使得利用產品數據持續優化成為可能。最終,自主訓練模型也發展成為公司內部一項核心且必須建設的能力。

主持人:2023年,你們還沒確定Cursor最終能否成功,還在討論應不應該換方向,產生營收還是花了挺久的吧?

Michael Truell:在2023年期間,我們的業務確實在逐步增長,盡管整體規模仍然不大。我們所處的領域(AI輔助編程)發展方向并不總是清晰的。有些市場可以通過系統性地調研用戶需求、逐一梳理問題、提出針對性解決方案并確定優先級,就能有效推進。但對我們這樣面向最終用戶、沒有太多預算的應用來說,情況則有所不同。

我們致力于探索如何利用當前技術,實現與AI協同編程的最佳體驗。很多功能在設想中很有價值,但具體如何實現、細節如何落地,路徑并不明確。因此,整個2023年我們都在不斷嘗試和摸索。

此外,在早期用戶反饋中,也存在一些方向上的拉扯。我們有一批活躍的非專業編程用戶,希望產品朝他們的需求傾斜;另一些用戶則強烈建議我們專注于某一特定技術棧,放棄通用性。我們最終沒有完全跟隨這些聲音,而是堅持了原有的產品定位。

這一年中,我們經歷了大量原型設計,就像在沙漠中探索一樣,逐步明確了哪些環節需要自主研發模型——例如優化API模型或實現諸如Tab自動補全、編輯預測等功能——而不僅僅依賴于外部技術。

五、產品增長靠口口相傳,傳統增長工程收效甚微

主持人:你們在2023年左右從零增長到100萬美元的ARR,對嗎?達到這個目標花了很多功夫吧?

Michael Truell:是的,比那多一點,但大致是這樣。

主持人:2024年是瘋狂的一年。你們在一年內從100萬美元ARR增長到1億美元ARR。跟我們講講這種復合增長的力量吧,因為你們一直保持著每周10%的增長。這是怎么實現的?

Michael Truell:早期的數字感覺很小,但后來復利效應持續顯現。有幾件事推動了我們的增長。我們所在的市場,只要你把產品做得更好,你就能立刻在數字上看到增長的加速。

當我們第一次開始讓Cursor能夠感知代碼庫時,第一次能夠預測你的下一個動作時,讓預測更準確時,讓它更快,讓它能夠預測一系列的變更時,我們都感受到了增長的提速。我們還讓模型在代碼庫中執行更多的動作。

我們一直專注于提升產品本身,復利效應一直持續。我們所處的市場中,終端用戶的喜好是十分關鍵的,如果能打造出最好的產品,人們就會關注它,討論它。

主持人:我想起那段時間發生的一件有趣的事。我們確實看到YC公司在創業營期間發生了一個巨大的轉變。我們會問他們用什么樣的技術棧來構建應用程序,每一期之間簡直是天壤之別。我記得在2023年,可能只有個位數的百分比的公司使用Cursor。然后到了2024年,比例已經來到80%。

Cursor就像野火一樣蔓延開來,最優秀的開發者都在用你們的產品。

Michael Truell:他們把Cursor發到自己的Twitter上。

主持人:你們的很多用戶增長都是這么來的嗎?所有的增長是如何實現的?

Michael Truell:在最早階段,當我們剛推出編輯器時,我們嘗試在社交網絡上進行宣傳。實際上,我的一位聯合創始人在2022年發現,可以通過在網上發帖獲得名氣,積累大量粉絲。這并不是通過常規的社交媒體操作,而是通過深入討論AI實現的。

令人驚訝的是,他居然可以通過讀論文,深入分析當時的發展趨勢,并公開分享自己的觀點,從而獲得該領域有影響力人士的認可。

當時有一個開源模型叫Flan T5。我的這位聯合創始人在推特上持續分享這一模型的信息,讓許多人了解到其優點。此后,有多個項目因他的分享,使用了這一開源模型。

我們的這位聯合創始人也因此成為舊金山一個小眾圈子里的知名人物,并在早期利用這一優勢,推廣產品。

當我們第一次發布產品并建立候補名單以獲取首批用戶時,在推特賬號上發布了一個幾乎像電影般的Demo,這對公司起步幫助很大。

但在2023年,我們幾乎像隱士一樣,專注于產品研發,主要依靠口碑傳播。我記得那一年,團隊中有人建議,產品已經足夠成熟,可以暫時放下,專注于增長工程。

我們進行了大約兩個月的沖刺,但與我們當年完成的其他工作相比,這些努力收效甚微。

主持人:到了2024年那個時候,Cursor的規模有多大?公司當時有多少人?

Michael Truell:在2023年規模還很小,我的聯合創始人們都是非常出色的工程師。我們當時有四個人,我們在不雇人的情況下已經做了很多工作了。

我們在招聘第一批員工以及具體如何操作上也有一些自己的想法,早期非常有耐心,同時也更少關注招聘,或許我們本應該多關注招聘的。2023年底的時候,員工還只有個位數,仍然不到10個人。

六、AI將成為工程師的“同事”,但不會影響編程教育的價值

主持人:太厲害了。我想換個話題,我很好奇,你對AI編程的未來有什么看法?

Michael Truell:從一開始,我們可能就算是走了一條中間路線。當我們創辦公司并招聘第一批員工時,經常會得到一些奇怪的眼神,大家會問:“你們這是在做什么?”

在2022年底,情況還不是現在這樣。那時,ChatGPT尚未出現,整個世界直到2023年初才開始意識到AI的潛力。尤其是在2022年,當我們在做CAD相關項目和早期代碼項目時,人們普遍覺得做AI有些奇怪。他們并不完全相信這是值得投入時間的事情,也不相信AI會帶來大量出色的應用。

即便是那些對AI感興趣的人,在我們的領域里,也有一部分人只關注優化已有產品的形式,僅僅讓產品稍微好一點而已。同時,在我們的社交和專業圈中,也有人會想:“為什么不去做AGI(通用人工智能)呢?你現在做的這些工作,一兩年后可能就會失去意義。”

我們一直認為,未來幾十年里,將會有大量非常有價值的東西可以去構建。AI將是一項變革性的技術,可能比近幾個世紀的任何技術革命都更具影響力。

但要實現這一目標,需要幾十年的努力,并且需要整個行業的參與,其中所有獨立能力都必須逐步完善,才能真正實現在計算機上完全改變軟件開發,或者變革其他知識工作領域的終極狀態。

在短期內,對于我們的終端用戶——職業工程師而言,代碼仍然非常重要。未來我們會經歷一個漫長而復雜的過渡階段,將與AI一起工作。AI會越來越像同事,同時也可能像一個高級編譯器,能夠為你隱藏部分代碼。但你仍然需要閱讀邏輯,審查并進行編輯。

主持人:那你認為哪些技能仍然重要?大家應該繼續學習什么,或者停止學習什么?

Michael Truell:我認為,編程就像數學一樣,是一種很好的通識教育,這種價值不會消失。而且,學習計算機科學還能帶來許多實用技能。

通常,當人們進入快速變化的行業時,學校里學的具體知識并不是最關鍵的,更重要的是在學習過程中培養的學習能力。我認為,AI的出現并不會改變這一點。

主持人:對于觀眾中那些年輕的、像三年前的你一樣的Michael Truell,你有什么建議?如果他們想成為三年前、在你創辦Cursor之前的你,現在應該做什么?

Michael Truell:我認為,應當去做自己感興趣的事情,并且與那些既相處得來,又彼此尊重的人一起合作。這非常重要。

對于許多在校學生來說,太多事情會把你引向“應付了事”的模式,而不是長期專注于打造真正有價值的東西。關鍵是專注于你真正感興趣的事,并長期投入其中。