深度|微軟 CEO 納德拉最新兩萬字洞察:C 端 Agent 商業(yè)模式仍需摸索,廣告流量模式或面臨轉變,B 端關鍵在生態(tài)集成
AI領域的競爭不再是單一的贏家通吃局面,而是多個企業(yè)在不同技術層面的激烈競爭。在這篇深度文章中,微軟CEO薩提亞·納德拉(Satya Nadella)分享了他對人工智能領域的最新洞察,包括對OpenAI的投資、智能體(Agent)的未來發(fā)展,以及AI如何塑造微軟的戰(zhàn)略轉型。
微軟 CEO Satya Nadella 在近日與硅谷知名投資人 Brad Gerstner 以及 Bill Gurley 討論了微軟的戰(zhàn)略轉型、對 OpenAI 投資以及智能體(Agent)的未來,全文兩萬字。
Nadella 認為,當前 AI 領域的競爭將不再是贏家通吃,而是多個企業(yè)在不同層次的技術領域展開激烈角逐。
特別是在基礎設施(如云計算)和應用(如 AI 模型)之間,他認為微軟的 Azure 和其他云服務將在未來的 AI 競爭中占據(jù)重要位置。
智能體(Agent)被視為比傳統(tǒng)搜索引擎更為智能和個性化的工具,不再是簡單的無狀態(tài)查詢工具,而是能夠保持狀態(tài)、記住用戶歷史并提供持續(xù)的互動。
Satya Nadella 提到,隨著消費者對 AI 的需求增加,傳統(tǒng)搜索引擎(如 Bing)面臨新挑戰(zhàn),未來將見證從傳統(tǒng)搜索到基于 AI 的問答系統(tǒng)的轉變。
智能體的出現(xiàn)可能打破了傳統(tǒng)搜索引擎的界限,能夠提供直接的答案,而不僅僅是鏈接,改變了用戶的互動方式。通過 ChatGPT 和類似的工具,用戶不再需要通過多次查詢來獲得答案,而是能得到更加即時和智能的反饋。
對于消費者端,智能體的商業(yè)模式仍在摸索中,傳統(tǒng)的廣告和流量驅動模式可能需要轉變,尤其是在智能體能夠通過簡化的對話來獲取和處理數(shù)據(jù)的情況下。
企業(yè)級的智能體接口可能會變得更加重要,微軟已經(jīng)在利用 AI 接入多個系統(tǒng),如 Adobe、SAP 和自家的 CRM(Dynamics)。這種接口可以幫助 AI 獲取和整合企業(yè)數(shù)據(jù),進而提供更高效的服務。
以下為全文內容:
Brad Gerstner
很高興和你在一起。當 Bill 和我在討論, Satya ,回顧你作為 CEO 的任期時,真的是一次很好的學習經(jīng)歷。可以說是相當艱難的,你在 1992 年就加入了微軟。對于那些可能不知道的人,你在 2007 年接管了微軟的在線業(yè)務。
你在 2009 年推出了 Bing 搜索,在 2011 年接管了服務器業(yè)務并推出了 Azure,而你在 2014 年成為了 CEO。就在那之前,有一篇現(xiàn)在已經(jīng)非常著名的文章《微軟的無關性》剛剛發(fā)表。
自那以后,你將 Azure 從 10 億美元的年收入提升到 660 億美元。整個業(yè)務的總收入增長了 2.5 倍,總利潤增長了超過 3 倍,股價也幾乎上漲了 10 倍。你為微軟的股東增加了近 3 萬億美元的價值。
回顧過去十年,你認為當時你最能做出的改變是什么?是如何解鎖價值、改變微軟的方向,并取得如此非凡的成功?
Satya Nadella
嗯。所以,我一直是這樣思考的,Brad,從 92 年到現(xiàn)在,某種意義上,它對我來說是一個連續(xù)的階段,盡管顯然,2014 年是一個重要的轉折點,伴隨著相應的責任。但是我覺得,歸根結底,成功和失敗的模式是可以匹配的,做更多的成功,少做失敗的事。
從某種意義上說,就是這么簡單,因為我經(jīng)歷過。當我在 92 年加入微軟時,那是剛剛發(fā)布了 Windows 3.1,我記得 Windows 3.1 是在 92 年 5 月發(fā)布的,而我是在 92 年 11 月加入的。
事實上,當時我在 Sun 公司工作,考慮要去商學院,后來收到了微軟的邀請,我本來想去商學院,但最終是因為我的上司說服我加入微軟,這成了我做過的最好的決定。
當時讓我決定加入的原因是 91 年的 PDC 展會,在 Maskoni Center,當時我看到了 Windows NT(那時它還沒有這個名字)和 x86,我心想,客戶端上發(fā)生的事情最終會在服務器上發(fā)生,這是一家平臺公司,一家合作伙伴公司,他們將乘著這股浪潮前進。所以這是當時我的考慮。
然后,網(wǎng)絡的出現(xiàn)讓我們經(jīng)歷了轉型,我們把很多事情做對了。比如說,我們意識到瀏覽器是我們的競爭對手,最終我們做對了瀏覽器這件事。
但在搜索領域我們失誤了,我們當時覺得,瀏覽器才是最重要的,因為它更像一個操作系統(tǒng),但我們沒有理解新類別的出現(xiàn),即互聯(lián)網(wǎng)的組織層是搜索。
然后我們也參與了移動互聯(lián)網(wǎng),但并沒有完全把握住。顯然,iPhone 的出現(xiàn)讓我們錯失了機會。而在云計算領域我們做對了。所以,如果我回顧這些事情,我們現(xiàn)在也正在經(jīng)歷 AI 的第四次變革。
在這些過程中,我認為最重要的是不要因為別人做了某事,我們就去盲目模仿。有時候,追隨潮流是可以的,結果也不錯,但你不應該因為嫉妒而做事。這是我們學到的最艱難的教訓之一。做事是因為你有這個權限,并且能夠做得更好,這兩者對我來說都很重要。
品牌的授權,比如說,Jeffrey Morre 曾經(jīng)對我說過一句話,他說,“你為什么不做客戶期待你做的事情呢?”我非常喜歡這句話,云計算就是一個很好的例子,客戶其實已經(jīng)期待我們做這件事了。
事實上,我第一次接觸 Azure 時,很多人告訴我,云計算是贏家通吃,亞馬遜已經(jīng)贏定了。我從來不相信這一點,因為畢竟,我曾和甲骨文、IBM 等公司競爭過服務器領域,我一直覺得,基礎設施領域絕對不可能是贏家通吃的。你只需要進入這個領域,提出一個有價值的解決方案。
從某種意義上說,很多這些轉型對我來說,就是確保你能夠認清自己在市場中的結構性位置,真正理解你在那些想要你成功的合作伙伴和客戶眼中所擁有的權限,并首先去做那些顯而易見的事情。
我認為,這也許可以稱作戰(zhàn)略的基礎,但對我而言,這就是關鍵。你提到的那些文化和使命感,都是必要的條件,甚至是實現(xiàn)目標的前提。但我認為,正是通過識別你的結構性位置和獲得授權,才可能做出正確的戰(zhàn)略調整。
Bill Gurley
等一下, Satya ,在我們談到 AI 之前,我有幾個問題想問關于過渡的事情。就像Brad剛才說的,你可能是史上最成功的 CEO 任命之一。我是說,3 萬億美元的市值是無與倫比的。首先,我讀過一篇文章,提到你為選擇 CEO 的委員會寫了一份 10 頁的備忘錄。這個是真的嗎?如果是真的,那份備忘錄里寫了些什么?
Satya Nadella
是的,的確如此。因為我覺得我們當時的 CEO 選拔過程非常公開,坦率地說,當時我并不確定自己會成為 CEO。記住,當時我從來沒想過, Bill 會離開,更別提 Steve 也會離開了。
你不可能加入微軟就想,“哦,創(chuàng)始人們會退休,會有一個職位空缺,我可以申請?!蹦菚r我并沒有這樣的心態(tài)。所以當史蒂夫決定退休時,記得是 2013 年 8 月,那對我來說是一個非常大的震驚。
那時,我還在負責我們的服務器和工具業(yè)務(Azure 就是在這其中),而我其實很享受那份工作,我也沒有主動提出要成為 CEO,因為當時并沒有這種想法。然后,董事會開始考慮這個問題,也有很多其他的候選人,包括內部的微軟高層。
最后,在選拔過程中,他們要求我們寫備忘錄,實際上,那份備忘錄非常有意思,里面我提到的很多內容,如果我現(xiàn)在回頭看,都很有預見性。例如,我在那份備忘錄中使用了“環(huán)境智能”和“普適計算”這些術語,我在第一封郵件中也用了這些詞,雖然我之后把它簡化成了“移動優(yōu)先,云優(yōu)先”,因為我的公關團隊過來問我:“這些詞太難理解了,沒人知道什么是環(huán)境智能,普適計算是什么?!?/p>
所以,我就用“移動優(yōu)先,云優(yōu)先”來表述,如何抓住大趨勢,理解微軟的結構性位置,思考微軟的云計算業(yè)務,我們有哪些資源,為什么 M365 這么重要。
事實上,我一直抗拒市場那種將云計算業(yè)務拆分的方式,我從不把我的資本分配成“這是 Azure 的資本,這里是 M365 的資本,這里是游戲的資本”。我一直認為,微軟的核心是一套基礎設施,在其之上有不同的工作負載,其中之一就是 Azure,另一個是 M365、Dynamics、游戲等。
總的來說,很多內容都在那份備忘錄里,實際上也都實現(xiàn)了。當時我也預料到,雖然我們在服務器和客戶端業(yè)務中有 98%、99% 的毛利率,但遷移到云計算時,毛利率可能會下降,但市場總量會更大。
我們會賣得更多,尤其是面向中小型企業(yè),甚至我們在上銷售方面也會有增長,像 Exchange、SharePoint 和 Teams 等產(chǎn)品,現(xiàn)在都得到了極大的擴展。這就是當時我在備忘錄中提到的基本構想。
Bill Gurley
那有沒有什么文化轉變的元素呢?我想,每年都有很多 CEO 的任命,但其中許多都失敗了。就像英特爾現(xiàn)在正在經(jīng)歷第二次重啟一樣。而且,正如 Brad 指出的,曾經(jīng)有人認為微軟就像 IBM 或數(shù)字設備公司(DEC),認為它的輝煌時光已經(jīng)過去。那么,你做了什么,又會給新任 CEO 提供什么建議,幫助他們重啟文化,并推動公司朝著不同的方向發(fā)展?
Satya Nadella
我認為,我的優(yōu)勢之一是,我是一個徹底的“內行”,對吧?我?guī)缀跽麄€職業(yè)生涯都在微軟度過。所以,從某種意義上講,如果我批評我們的文化,實際上是在批評我自己。
因此,某種程度上,我獲得的突破是,大家從來沒有覺得我像外部的人來批評在場的這些人,而是更多地把指責指向我自己,因為我?guī)缀跏沁@文化的一部分,你明白嗎?我不能說任何我不參與的事。
記得 Bill,你提到的這一點,我清楚地記得第一次微軟成為市值最大的公司時。我記得在公司校園里走來走去,我們所有人,包括我在內,都顯得非常自豪,好像我們真的是人類的最偉大的創(chuàng)造,我們的聰明才智終于在市值上得到了體現(xiàn)。
我總覺得,這種文化是我們必須避免的,因為從古希臘到現(xiàn)代硅谷,唯一能摧毀文明、國家和公司的就是“傲慢”。所以其中一個最重要的轉折點,是我的妻子在我成為 CEO 之前幾年前,給我推薦了一本書——Carol Dweck 的《心態(tài)》(Mindset),我當時是為了孩子的教育和培養(yǎng)看的,沒想到這本書給了我非常大的啟發(fā)。
我覺得,這本書的理念太棒了。我們一直在討論學習和學習型文化,而這正是我們能選擇的最佳文化理念。因此,我把我們文化上的成功,歸功于這一理念,因為它不僅僅是微軟的理念,它適用于生活中的方方面面。
你可以用這種思維方式去成為更好的父母、更好的伴侶、更好的朋友、更好的鄰居和更好的經(jīng)理人、領導者。所以我們采納了這個理念,而我一直用的一句話就是,把“知道一切的人”轉變?yōu)椤皩W習一切的人”。這是一個永遠也到達不了的目標,因為一旦你說自己有了“成長型心態(tài)”,那你就不可能真正擁有它了。
因此,這個理念對我們幫助很大。文化變革就像所有文化轉變一樣,需要時間,需要空間,讓它自然生長。而且這種轉變既是自上而下的,也有自下而上的推動,它是相輔相成的。事實上,每次我和公司,甚至我的高管團隊開會時,我都會從“使命”和“文化”開始,這兩者是我們討論的兩大支柱。
至于其他方面,我也一直很有紀律性地堅持我的框架,正如我在備忘錄中所寫的那樣,幾乎過去 11 年,我堅持的結構和理念是一樣的:使命與文化,這就是世界觀。
比如,環(huán)境智能、普適計算,接著是具體的產(chǎn)品和戰(zhàn)略框架。我會非常謹慎地選擇每一個詞,極為細心地重復它,直到我自己都感到厭倦,但我仍然堅持下去。
Brad Gerstner
說到這個,你提到過我們經(jīng)歷的階段變化,我聽你說過,作為一家大型平臺公司,大多數(shù)價值的捕獲其實是在階段變化的前三到四年內就決定了,那時市場位置已經(jīng)確定了。
我聽你說過,微軟錯失了搜索,也錯失了移動,但你也說過,微軟抓住了云計算的“最后一班車”。那么,當你開始思考下一個大階段的變化時,似乎你和團隊中的其他人,包括 Kevin Scott,早早就意識到,谷歌在 AI 方面可能領先一步,畢竟他們擁有 DeepMind。
你們決定投資 OpenAI。是什么讓你確信這個方向,而不是繼續(xù)推進微軟內部的 AI 研究?
Satya Nadella
這個問題提得非常好。因為這里有幾個方面。首先,我們在 AI 領域已經(jīng)深入探索了很長時間了。顯然, Bill 在 1995 年創(chuàng)辦了微軟研究院(MSR),我記得第一個小組,其實是圍繞自然用戶界面展開的。
那時,微軟研究院里也有很多人,包括 Regret、Kaifu 等,大家一直在試圖解決語言理解的問題,甚至包括 Hinton 的早期工作,在他還在微軟研究院時就做了一些關于 DNS 的研究,然后他去了谷歌。所以,我認為我們早期錯過了與谷歌同步加大對 AI 的投資,錯過了在谷歌收購 DeepMind 時的機會。
這個讓我感到非常遺憾。但是,作為一個領導者,我一直專注于一些其他方向。例如,Skype 翻譯就是我關注的第一個項目,因為它非常有趣——那是第一次我們看到遷移學習的有效應用。也就是說,我們可以先在一對語言上進行訓練,然后它能在另一對語言上也表現(xiàn)得更好。
這是我們第一次能夠說,“哇,機器翻譯也可以是 DNS”,這和我們之前做的完全不一樣。所以,從那時起,我就開始對語言感到著迷,凱文也是一樣。實際上,我還記得第一次和 Elon 和 Sam 見面時,他們主要是想要一些 Azure 的信用額度,那時他們更多關注的是強化學習(RL)和《Dota 2》。
然后一段時間后,我們又和他們談到了自然語言處理(NLP)。那時他們談到了 transformers 和自然語言處理。我當時就覺得,這對我們來說是核心業(yè)務,而且也與我們長期以來的結構性定位相符。
我一直覺得,如果有某種突破性的模型架構能夠產(chǎn)生非線性增長,展現(xiàn)出類似于我們以前從未見過的能力,那對我們來說,可能就是一個極大的機會。
Bill,你總是說,“在數(shù)字領域,只有一個類別,那就是信息管理”。你覺得,信息是通過某種方式來整理的。像我們曾經(jīng)做過一個非常有名的項目叫 WinFS,就是想通過給所有的東西做 schema 來讓所有的信息都能被理順。
但其實這是不可能做到的。因此,我們需要一些突破。我當時想,或許通過某種方式把信息整理成語言,類似于人類大腦如何通過語言和推理來組織信息。
這也就是為什么我們決定投資 OpenAI,事實上,Sam、Greg 和團隊的雄心也是促使我做出決定的另一個原因。
至于“規(guī)模法則”,我還記得,第一次我看到關于“規(guī)模法則”的備忘錄時,正是 Dario 和 Ilia 在 OpenAI 時寫的。
那時候我就想,“如果這個領域真的能帶來指數(shù)級的性能提升,那為什么不全力以赴,給它一個真正的機會呢?”然后,當我們在 GitHub Copilot 上看到了它的效果,覺得真的行得通,之后我們就決定加大投入。所以,那就是最初的動機。
Bill Gurley
我覺得,在過去的階段變化中,有些 incumbents 沒有迅速跟上節(jié)奏。你甚至提到過,微軟可能錯失了移動或搜索等機會??梢哉f,尤其是我這個年紀,親眼見證過這些變化,現(xiàn)在大家似乎都已經(jīng)清醒過來了,或者說這一輪的變化就像是精心編排的,每個人幾乎都在同一起跑線上。
我很想知道你是否同意這一點,或者你是如何看待競爭中的關鍵玩家,比如谷歌、亞馬遜、Meta、Llama,還有進入游戲的 Elon。
Satya Nadella
這是個很有意思的觀點。正如你所說,我也一直在思考這個問題。如果你回顧90年代末,當時微軟是獨占鰲頭,幾乎沒有競爭對手。但現(xiàn)在,大家談論的是所謂的“MAG 7”,可能還不止這些,正如你所說,每個人都已經(jīng)意識到這一點了,大家都有強大的資產(chǎn)負債表。
甚至可以說,OpenAI 從某種意義上可以視為第 8 大玩家。因為這一代的公司已經(jīng)在某種意義上成立了——OpenAI 就像是這一時代的谷歌、微軟或 Meta。所以,我認為,接下來的競爭會非常激烈。
我也認為這不會是“贏家通吃”的局面,雖然有些領域可能會出現(xiàn)這種情況。比如在超大規(guī)模(hyper-scale)方面,絕對不會是贏家通吃。全球甚至包括中國之外的市場,都會需要多個提供前沿模型的供應商,分布在全球各地。
事實上,我認為微軟在這方面有一個非常好的結構性優(yōu)勢——你記得 Azure 吧?它的結構有點不同。我們?yōu)槠髽I(yè)工作負載構建了 Azure,關注數(shù)據(jù)駐留問題,支持超過 60 個地區(qū),甚至比其他云服務商還多。
所以,我們不是為了一個大應用構建云,而是為了多種異構的企業(yè)工作負載構建云,我認為這將是未來推理需求的主戰(zhàn)場,與數(shù)據(jù)中心和應用服務器相結合。因此,我認為在基礎設施方面會有多個贏家,在模型方面也一樣,每個超大規(guī)模云提供商都會有一堆模型,圍繞這些模型會有一個應用服務器。
像今天的每個應用,包括 Copilot,都是一個多模型應用。實際上會出現(xiàn)一個全新的應用服務器,就像曾經(jīng)有移動應用服務器和 web 應用服務器一樣,現(xiàn)在有了 AI 應用服務器。
對于我們來說,這個就是 Foundry,我們正在構建它,其他公司也會構建類似的東西,未來會有多個這樣的服務器。
在應用層面,我認為網(wǎng)絡效應始終會存在于軟件層。所以在應用層,會有不同的網(wǎng)絡效應,既包括消費者端,也包括企業(yè)端。
所以,從根本上講,我認為你必須從結構性層面進行分析,不同的層級之間會有非常激烈的競爭,7、8、9、10 大公司會在不同的技術層面展開激烈角逐。
正如我一直跟我們的團隊說的,要關注那些后來者,那個突然冒出來的創(chuàng)業(yè)者。你們要密切關注哪些新興公司會給你們帶來改變,至少 OpenAI 就是其中之一。到現(xiàn)在為止,它已經(jīng)具備了規(guī)模和速度。
Brad Gerstner
說到這一點,如果我們把焦點放在應用層,首先談談消費者 AI。Bing 是一個非常大的業(yè)務,你和我曾經(jīng)討論過,“10 個藍色鏈接”可能是資本主義歷史上最成功的商業(yè)模式,但它面臨著一種新模式的巨大威脅,那就是消費者現(xiàn)在只想要答案。
舉個例子,我的孩子們就說,為什么我要去搜索引擎,直接得到答案不好嗎?那么,你認為谷歌和 Bing 能繼續(xù)在答案時代中保持增長嗎?
Bing 或者你在 Mustafa 領導下的消費者業(yè)務需要做什么,才能和 ChatGPT 競爭,畢竟從消費者的角度看,ChatGPT 已經(jīng)是一個非常突出的存在。
Satya Nadella
是的,我認為你說的第一點非常對,那就是聊天與答案的結合,正是 ChatGPT 這款產(chǎn)品,正如你所說,它不僅僅是一個搜索引擎,還是一種狀態(tài)化的智能體,真正打破了傳統(tǒng)搜索的局限。
傳統(tǒng)搜索引擎是無狀態(tài)的,你進行搜索時,雖然有歷史記錄,但每次搜索都是一次新的查詢。而現(xiàn)在,這些智能體會變得更加直觀、持續(xù)和“有記憶”。
因此,這也是我為什么這么高興的原因——我一直在努力與蘋果達成搜索協(xié)議,已經(jīng)有 10 年了。所以,當 Tim 最終與 Sam 達成合作時,我真是激動不已。對我們來說,ChatGPT 拿下這個協(xié)議,比其他任何人都更有意義,因為我們和 OpenAI 建立了商業(yè)和投資關系。
就這一點而言,我認為,分發(fā)渠道仍然非常重要。谷歌在這方面有巨大的優(yōu)勢,畢竟他們在蘋果上是默認搜索引擎,在 Android 上也是。它們觸及到了龐大的用戶基礎。
但是,習慣一旦形成就很難改變。就像你提到的,即便我現(xiàn)在更偏向使用 Copilot,我的使用習慣仍然是在瀏覽器中直接輸入查詢,甚至有時候即使是我使用 Copilot,搜索引擎的功能仍然有其獨特的價值。像我在處理導航信息時,會去 Bing 搜索,而其他問題我更傾向于使用 Copilot。
我認為這種變化是普遍發(fā)生的。我們離某些商業(yè)查詢完全遷移到聊天形式也只差一兩步。當商業(yè)意圖也遷移到聊天平臺時,傳統(tǒng)搜索引擎就可能面臨真正的挑戰(zhàn)。
現(xiàn)在,商業(yè)意圖還沒有完全轉移,所以傳統(tǒng)的搜索引擎業(yè)務還在運轉。但一旦這種商業(yè)意圖轉移,傳統(tǒng)搜索就會面臨重大挑戰(zhàn)。因此,我認為,這是一場長期的結構性變化。
我們在 Mustafa 的團隊管理下有三大核心產(chǎn)品:Bing、MSN 和 Copilot。所以我們認為,實際上他已經(jīng)清晰地定義了這三者的角色,它們共同構成了一個生態(tài)系統(tǒng)。
一個是傳統(tǒng)的搜索引擎,一個是新聞和信息流,一個是新的智能體界面。它們和內容提供商有著社交契約,我們需要為他們帶來流量,同時可能需要付費墻、廣告支持等模式。這就是我們正在管理的方式,我們已經(jīng)有了自己的分發(fā)渠道。
我們唯一仍然擁有的優(yōu)勢之一就是 Windows。雖然我們錯失了瀏覽器市場,Chrome 已經(jīng)成為主導瀏覽器,這對我們來說是一次失敗,但我們正在通過 Edge 和 Copilot 重新贏回市場。Windows 對我們來說,至少在某些方面,仍然是一個開放的系統(tǒng),這意味著,像 ChatGPT 和 Gemini 都有機會在上面發(fā)揮自己的優(yōu)勢。微軟并不限制他們的發(fā)揮,反而可以帶來更多的競爭和創(chuàng)新。
Bill Gurley
Satya, 大家都在談論這些智能體。你如果展望未來,可以想象,很多玩家會希望在其他應用和系統(tǒng)中的數(shù)據(jù)上采取行動。
微軟在這方面的處境很有意思,因為你們控制著 Windows 生態(tài)系統(tǒng),但你們的應用也出現(xiàn)在 iPhone 和 Android 生態(tài)系統(tǒng)中。你怎么看待這種情況?
這其中既有服務層面的問題,也有合作伙伴關系的問題,蘋果會允許微軟控制 iOS 上的其他應用嗎?微軟會允許 ChatGPT 在 Windows 上啟動應用并獲取應用數(shù)據(jù)嗎?這個問題會延伸到搜索和電商等領域——比如,像 Booking.com 會允許 Gemini 在沒有他們的許可或知情下進行交易嗎?
Satya Nadella
是的,我認為這個問題非常有意思。某種程度上,現(xiàn)在還不清楚這將如何實現(xiàn)。的確,有一種非常傳統(tǒng)的思維方式,回想一下,企業(yè)應用程序如何實現(xiàn)中斷操作。它們通常通過連接器來進行中斷,用戶需要購買連接器許可證。
因此,某種商業(yè)模式就這樣出現(xiàn)了。SAP 就是一個經(jīng)典的例子,你可以通過擁有連接器來訪問 SAP 數(shù)據(jù)。我覺得,當智能體之間的接口出現(xiàn)時,類似的模式可能會再次出現(xiàn)。但對于消費者來說,這種模式還不太明確,因為在消費者端,價值交換往往是通過廣告和流量等方式實現(xiàn)的,而在智能體世界中,這些方式可能會發(fā)生變化。
所以,消費者端的商業(yè)模式對我來說仍然稍顯不明晰。但在企業(yè)端,我認為最終會出現(xiàn)這樣一種情況:大家都會說,為了讓你進入我的操作空間或者從我的架構中提取數(shù)據(jù),必須通過某種形式的智能體接口,且這個接口是有許可的。
例如,今天我在微軟使用 Copilot 時,我有連接器接入 Adobe、SAP 實例以及我們的 CRM(Dynamics)。這種模式非常有趣。事實上,想一想,我們已經(jīng)很久沒有真正去使用那些企業(yè)應用程序了。
我們許可了許多 SaaS 應用程序,但實際上很少有人親自使用它們,更多的是公司內部某些人在輸入數(shù)據(jù)。但在 AI 時代,這種情況發(fā)生了變化,因為所有數(shù)據(jù)變得更加易于訪問。
你可以輕松地進行查詢,比如,“我要和 Bill 開會,告訴我所有 Benchmark 投資過的公司。”這時,AI 會從網(wǎng)絡上、CRM 數(shù)據(jù)庫中提取相關信息,整合起來,提供一個總結或筆記。
Bill Gurley
從某種程度上來說,這些內容都能通過我們或這些連接器進行貨幣化。但更明確的一點是,像 ChatGPT 是否能在 Windows 操作系統(tǒng)上直接打開隨機應用程序并獲取數(shù)據(jù),這個問題已經(jīng)有很多討論了。你怎么看待這個問題?
Satya Nadella
這是個有趣的問題。誰能允許這種行為呢?是用戶,還是操作系統(tǒng)?在 Windows 上,坦率地說,我沒有辦法阻止這種行為,除了通過一些安全防護措施。
所以,理論上,我可以通過一些手段來確保這類行為是安全的。我最大的擔憂是安全風險。如果惡意軟件被下載,并開始在系統(tǒng)中執(zhí)行操作,那就是一個巨大的風險。因此,我認為我們將把這種權限控制集成到操作系統(tǒng)中,設置一些更高的訪問權限和權限管理。
但是,最終,用戶將能夠在 Windows 這樣的開放平臺上控制這些行為。我相信蘋果和谷歌會有更多控制權限,因此它們不會允許這種行為發(fā)生。
從這個角度看,你可以說,開放平臺像 Windows 就有這樣的一個優(yōu)勢,而蘋果和谷歌的封閉系統(tǒng)則有它們自己的優(yōu)勢,最終我們要看各方如何規(guī)定這些規(guī)則。
Bill Gurley
我們可以從另一個角度來看這個問題,然后再繼續(xù)討論。如果是 Android 操作系統(tǒng),或者我們稱之為 Android AI,或者 iOS AI,能讀取通過微軟客戶端在手機上的電子郵件嗎?
Satya Nadella
是的,我一直在想這個問題。例如,今天我們已經(jīng)許可了 Apple Mail 的 Outlook 同步。這個案例很有趣,我認為可能會有一些價值泄漏,但同時,這也是我們能保住 Exchange 的原因之一
。如果我們當時沒有做這個許可,可能會更加麻煩。因此,我認為,回到 Bill 你的問題,我們在構建 Microsoft 365 時,必須圍繞信任系統(tǒng)進行設計。我們不能讓任何智能體進入并做任何事,因為首先,它不是我們的數(shù)據(jù),而是客戶的數(shù)據(jù)。所以,客戶必須同意,而客戶的 IT 部門也必須允許。這不是我能隨便設定的一個開關。
第二點是,它必須具備一個信任邊界。所以,我認為我們會在 M365 上實現(xiàn)這樣的功能,這樣的操作就像 Apple 的智能管理一樣。想象一下,我們會為 M365 建立類似的信任和治理結構。
Bill Gurley
今天你談了很多內容,我強烈推薦大家下載并深入了解,因為這真的是非常有意思。
Brad Gerstner
那么,Satya,繼續(xù)深入這個話題。Mustafa 曾提到 2025 年將是“無限記憶”的年代。Bill 和我從今年年初開始就一直討論,認為下一個 10 倍的飛躍很可能正是 ChatGPT 所帶來的持久記憶,并且能在我們授權下執(zhí)行操作。
我們已經(jīng)看到記憶的初步實現(xiàn),我也非常相信 2025 年這一問題將基本解決。但是,關于執(zhí)行操作的問題,我們什么時候能夠對 ChatGPT 說,“請幫我預定下周二在西雅圖四季酒店的最低價格房間”?Bill 和我對此有過多次討論,似乎計算機使用場景是這個問題的早期測試案例。那么你有什么想法,是否認為這是一個困難的問題呢?
Satya Nadella
是的,我同意你的看法,最具開放性和無限可能的操作空間仍然非常困難。但如你所說,確實有兩三點非常激動人心,超越了模型本身的擴展性和原始能力。其中之一是記憶,另一個是工具使用或執(zhí)行操作,還有一個我想提的是權限管理。
就是說,你可以做什么?比如我們在微軟的 Purview 產(chǎn)品,越來越多的是,你擁有哪些權限,你可以安全地訪問哪些數(shù)據(jù),誰來進行管理和治理。
所以,當你把這些都結合在一起時,智能體的行為會變得更加可管理。執(zhí)行操作時,它是可驗證的,并且具有記憶功能,那么你就會進入一個完全不同的階段,可以處理更多自主任務。
不過,我一直認為,無論在完全自主的世界里,我們仍然會面臨例外情況,你可能需要請求許可,或者需要調用其他操作。因此,我們仍然需要一個 UI 層來組織這些工作。正因為如此,我們將 Copilot 視為工作文檔和工作流程的組織層。
但回到你的核心問題,我認為即便是模型達到 4.0(甚至不是 0.1,4.0 已經(jīng)非常好),功能調用也仍然有限。尤其是在消費者端,Web 功能調用依然非常困難。
至少在開放網(wǎng)絡上,它可以完成幾個網(wǎng)站的操作,但一旦涉及到預訂機票、酒店等任務,如果后端架構發(fā)生了變化,它就會出問題,盡管可以通過學習改進。但我認為,這仍然需要一年到兩年時間,才能完成更多的功能。
從企業(yè)角度來看,去做銷售智能體、市場營銷智能體、供應鏈智能體等工作,已經(jīng)有一些進展。例如,在 Dynamics 中,我們已經(jīng)實現(xiàn)了 10 到 15 個智能體,可以自動處理供應商通訊、更新數(shù)據(jù)庫、調整庫存等任務。這些都可以在今天完成。
Bill Gurley
Mustafa 提到關于近乎無限記憶的評論,嗯,我相信你們應該聽過或在內部討論過。你能就此提供一些澄清嗎?還是這部分內容還未公開?
Satya Nadella
我認為,從某種程度上來說,記憶系統(tǒng)就像是你有一個類型系統(tǒng),對吧?這就是關鍵。它不是每次都重新開始。你得組織起來。
Bill Gurley
我明白了。他的意思是你們在這方面有技術突破?
Satya Nadella
是的,實際上我們做了一個開源項目,我記得是 TypeScript 團隊做的。我們嘗試的是把記憶進行結構化處理,使得每次我啟動時,能夠基于之前的操作進行聚類,然后進行類型匹配,這樣就可以逐步構建一個記憶系統(tǒng)。
Brad Gerstner
那我們換個話題談談企業(yè) AI。你提到微軟的 AI 業(yè)務已經(jīng)約有 100 億美元收入,且這部分都是推理任務,不是租賃原始 GPU 進行訓練。你怎么看目前市場上是否有重大工作負載轉移的問題?目前你們的收入產(chǎn)品是哪些?
Satya Nadella
是的,實際上大部分與 OpenAI 的訓練合作更多是投資層面的內容,不會直接出現(xiàn)在我們的季度財報中,而是在其他收入項目中,基于我們的投資。
Brad Gerstner
所以這意味著你們的收入或虧損主要體現(xiàn)在其他收入或虧損部分,對吧?
Satya Nadella
沒錯,就是這樣。所以,大部分的收入或者所有的收入幾乎都來自于我們的 API 業(yè)務,或者說,像 ChatGPT 的推理成本也是其中的一部分。
這是一個不同的部分?,F(xiàn)在,時代中的“爆款”應用是什么?ChatGPT、Copilot、GitHub Copilot,以及 OpenAI 和 Azure OpenAI 的 API??梢哉f,如果你列出這些最受歡迎的應用,應該差不多就是這幾個。所以這就是最大的驅動力。
我們和 OpenAI 的優(yōu)勢在于,我們擁有了兩年的先發(fā)優(yōu)勢,幾乎沒有競爭對手,正如 Bill 提到的,大家都已經(jīng)醒過來了,但我覺得可能再也不會有像這樣的兩年領先的機會了。誰知道呢?
你說得對,總會有其他團隊放出什么樣本突然打破世界。不過,我認為要通過某個基礎模型建立這種領先地位是非常不容易的。但我們有這個優(yōu)勢,尤其是 OpenAI,能夠借此建立起 ChatGPT 的加速軌道。
Brad Gerstner
你認為其他公司訓練這些模型和模型集群在它們的 AI 收入中占了更大比例,而不像你們這樣?
Satya Nadella
我不確定。我只能說,看看其他公司有哪些“爆款”應用,我不清楚它們具體運行哪些模型,在哪些地方運行。我猜像 Google 的 Gemini 也是其中之一。根據(jù)任何 AI 產(chǎn)品的 DAU 數(shù)字,ChatGPT 是其中之一,甚至 Gemini 也讓我很驚訝。
雖然我認為它會因為本身的分發(fā)能力而增長,但很有意思的一點是,盡管大家都在談論 AI 的規(guī)模,但真正的“爆款”應用并不多。比如,ChatGPT、GitHub Copilot、Copilot 以及 Gemini,這些應該是最為人熟知的幾個。
Brad Gerstner
嗯,確實也有很多創(chuàng)業(yè)公司在往下走,逐漸得到一些關注,很多是基于 Llama 構建的。
Satya Nadella
不過,如果你說,哦,還有 Meta 呢?但如果你問 10 個更有影響力的應用,有超過 500 萬 DAU 的,能列出多少?
Brad Gerstner
我認為 Zuckerberg 可能會爭辯說 Meta 的 AI 肯定也有超過 500 萬 DAU,但就你提到的獨立應用來說,確實如你所說,Zach 的技術全都運行在自家平臺上。
Satya Nadella
他不依賴公共云。
Bill Gurley
Satya,說到企業(yè)端,編程空間也已經(jīng)開始加速了,你們在這方面表現(xiàn)不錯,市場也很感興趣。我有個問題關于 Copilot 的做法。我知道 Mark Benioff 在這方面有些批評,叫它“Clippy 版”,或者其他的。
你是否擔心有人認為 AI 應該從零開始,重新構建整個基礎設施,例如,像 Excel 這種工具,是否仍然是必要的,還是你們能夠通過 AI 首先的產(chǎn)品來省略掉這些不必要的元素?同樣的情況也適用于 CRM。其實也許很多字段和任務可以通過 AI 來簡化或隱藏。
Satya Nadella
這個問題非常重要。對于 SaaS 應用程序或業(yè)務應用程序,我可以談談我們自己在 Dynamics 上的做法。我們的思路是,隨著智能體時代的到來,業(yè)務應用將可能會迎來一個集成的變化。
因為如果你想一想,它們本質上是由一堆業(yè)務邏輯構成的共享數(shù)據(jù)庫,這些邏輯將轉移到這些智能體中,這些智能體將進行多庫更新。所有的業(yè)務邏輯將集中在 AI 層,換句話說,AI 將成為一切業(yè)務邏輯的核心。一旦 AI 層成為業(yè)務邏輯的核心,所有的后端都將被替代。
我們目前在 Dynamics 上的勝利率很高,尤其是在智能體使用方面。我們正積極推進這項工作,想把它整合進整個流程。不僅僅是 CRM,實際上我們的財務和運營部分也在經(jīng)歷類似的變化,因為大家希望看到更具 AI 原生性質的業(yè)務應用。也就是說,業(yè)務應用的邏輯層能夠由 AI 和智能體來調度,使得企業(yè)應用變得更加無縫。
另外,你也可以問,為什么還需要 Excel 呢?實際上,我最興奮的一件事就是,Excel 與 Python 結合的效果,簡直就像 GitHub 與 Copilot 的結合一樣。我們做的就是將 Excel 與 Copilot 配合使用,不再只是簡單地處理數(shù)據(jù),而是讓它能像一個數(shù)據(jù)分析師一樣為你計劃整個過程。
它能自動生成計劃,然后執(zhí)行這些計劃。這就像是一個數(shù)據(jù)分析師,利用 Excel 來進行數(shù)據(jù)分析,它不僅僅是一個“行列”視圖,更是可以實現(xiàn)實際操作的“工具”。
Brad Gerstner
我今天聽到一個人們討論最多的問題,就是這些投資的 ROI 問題。你們有超過 22.5 萬員工。你們在內部是否利用 AI 來提高生產(chǎn)力、降低成本,還是推動收入增長?如果有,能舉些具體的例子嗎?
另外,關于 Jensen 之前的說法,他說當營收增長兩三倍時,預計員工人數(shù)增長 25%。如果 Azure 的營收增長 2 到 3 倍,你們是否也預期員工人數(shù)會呈現(xiàn)類似的增長?
Satya Nadella
是的,實際上這是我們現(xiàn)在微軟非常關注的內容,也是客戶非常關心的話題。我是這么來看待的,我非常喜歡從工業(yè)公司精益管理的經(jīng)驗中學習。對吧?這一點真的很有意思。比如,這些公司的增長通常都超過 GDP 增長,非常了不起。
這些好的工業(yè)公司可以通過精益管理提高 200 到 300 個基點,增加價值、減少浪費。這就是精益管理的做法。所以我覺得 AI 就像是知識工作中的精益管理。
我們真的在向這些工業(yè)公司學習,比如說,如何去觀察流程的效率,如何找到可以自動化的部分,如何讓流程更高效。所以,客戶服務就是最明顯的例子之一。
我們在這方面投入了大約 40 億美元,從 Xbox 支持到 Azure 支持都涵蓋其中。事實上,這是非常嚴肅的投入。通過前端的引導率,我們能夠提高智能體的工作效率,最重要的是,智能體更快樂,客戶更滿意,我們的成本也在下降。
這是最明顯的例子之一,另外就是 GitHub Copilot。它也是一個非常典型的例子。在 GitHub Copilot 工作空間中,你從一個問題開始,到一個計劃,然后執(zhí)行或指定一個計劃,接著是多文件編輯。它完全改變了團隊的工作流程。
再來是 365,M365 的 Copilot,也可以作為一個范例。比如,以我個人的經(jīng)驗來看,每次與客戶會面時,CEO 辦公室的準備工作自 1990 年以來幾乎沒有發(fā)生什么變化。
實際上,我這樣看待它——想象一下,電腦出現(xiàn)之前,如何做財務預測?我們使用傳真機,內部備忘錄,直到個人電腦開始普及,人們才開始用 Excel 表格發(fā)送電子郵件,大家交換數(shù)字、形成預測。
現(xiàn)在,AI 時代已經(jīng)來臨,事情發(fā)生了改變。我自己準備客戶會議時,我會進入 Copilot,詢問:“請告訴我我需要了解的關于這個客戶的所有信息?!彼鼤奈业?CRM、郵件、Teams 會議記錄以及網(wǎng)絡上收集信息并提供給我。我可以根據(jù)這些信息創(chuàng)建頁面,并實時分享給我的團隊。
想象一下,以前 CEO 辦公室的匯報方式就不再需要了,這些內容僅需通過查詢生成,甚至可以實時共享頁面,團隊成員可以直接在上面做標注。因此,我與 AI 協(xié)同工作,實時與我的同事合作。這是新的工作流,正在各個領域普及。
比如有個供應鏈領域的例子:有人說供應鏈就像一個交易臺,只是缺少實時信息。你必須等到財務季度結束,然后 CFO 才會來責怪你之前的錯誤。
那么如果財務分析師能夠在實時提供給你反饋呢?比如你在為某個數(shù)據(jù)中心制定合同,AI 可能會提醒你該考慮哪些條款。所有這些實時的智能反饋正在改變工作流程和工作產(chǎn)物。所以,我們看到很多類似的案例。
我想你的核心問題是,如何通過 AI 實現(xiàn)運營杠桿。這就是我們希望達到的目標。我們期望通過 AI 降低人力成本,但每個人的產(chǎn)出會更高。我的研究人員,可能他們每人的 GPU 使用效率都會更高。這就是我對這件事的看法。
Brad Gerstner
這很有道理。好,我們換個話題,談談之前你提到的模型擴展和資本支出的問題。我聽你說過關于微軟的資本支出。想象一下在 2014 年你接管時,你可能沒想到資本支出會變成今天這個樣子。
事實上,你曾提到,今天這些公司看起來越來越像是工業(yè)公司的資本支出,而不像傳統(tǒng)的軟件公司。你的資本支出從 2020 年的 200 億增長到 2025 年可能達到 700 億。你們的資本支出與收入之間的關聯(lián)非常高,這很有意思。
一些人擔心這種關聯(lián)可能會打破,甚至你自己也曾提到,未來可能會出現(xiàn)“資本支出需要先行”這種情況,我們可能需要為這種彈性做好準備。那么你怎么看待這個資本支出的水平?它是否讓你晚上睡不著覺?這種增長率會在什么時候開始放緩?
Satya Nadella
嗯,這里有幾個方面。首先,作為一個超大規(guī)模的公司,實際上我們在這方面有著結構性的優(yōu)勢,因為我們已經(jīng)在實踐這一切很長時間了。數(shù)據(jù)中心有 20 年的生命周期,只有在使用設備時你才需要支付電力費用,而硬件的使用周期大約是 6 年,你知道如何提高設備的利用率。
這些都是我們已知的。而且好消息是,這不僅是資本密集型的,它同樣也是軟件密集型的。你可以通過軟件來提高資本回報率(ROIC)。
實際上,最初很多人都在想,像微軟這樣的超大規(guī)模公司怎么能賺錢?和老式的托管公司相比,新的超大規(guī)模公司有什么區(qū)別?答案就是:軟件。這一點在 AI 加速器的建設中也同樣適用——通過領先的技術建設,我們能夠更好地利用資本。
事實上,當前一個趨勢是所謂的“趕超”。過去 15 年里,我們不斷建設和擴展基礎設施,但突然間,一個新的需求出現(xiàn)在云計算中,這個需求就是 AI 加速器。因為現(xiàn)在每個應用都需要一個數(shù)據(jù)庫、一個 Kubernetes 集群和一個 AI 加速器。你如果要同時提供這三種服務,你就必須大規(guī)模建設 AI 加速器。這種需求將會逐漸規(guī)范化。首先是建造,之后是工作負載的規(guī)范化。最終,這一切就會像云計算一樣,繼續(xù)增長。
所以,我們會繼續(xù)增長,確保這些工作負載的需求多樣化,避免出現(xiàn)不利選擇,只是單純基于供給方面建設,我們確保全球各地都能產(chǎn)生真實的需求。我會關注這些因素。這就是如何管理資本回報率的方法。
另外,關于利潤率,肯定會有所不同。我們早期討論過,微軟云的利潤率和 GPU 原始硬件的利潤率是不同的。這些會有不同的利潤率,例如像云架構、GPU 和應用程序相結合的層次,像 GitHub Copilot 或 M365 等。這些都有不同的利潤率。所以,在 AI 時代,我們的戰(zhàn)略也是繼續(xù)保持多元化的產(chǎn)品組合,確保利潤的最大化。
事實上,微軟在云計算中的優(yōu)勢之一就是,我們不僅規(guī)模比亞馬遜大,而且增長速度也超過亞馬遜,利潤率還比亞馬遜高。這正是因為我們在多個層次上進行了深度的布局。這正是我們希望在 AI 時代延續(xù)的策略。
Bill Gurley
因為最近關于模型擴展的討論很多,顯然歷史上也曾討論過如何多次擴展集群規(guī)模,而不是一次性擴展到某個規(guī)模。最近有一檔播客中,他們徹底改變了思路,說如果我們不再這么做了,那樣反而更好,因為我們可以直接進入推理階段,這個階段變得更便宜了,而且不需要花費大量的資本支出。我很好奇,這兩種觀點雖然是同一枚硬幣的兩面,但你怎么看大規(guī)模 LLM 模型的擴展和訓練成本,未來會如何發(fā)展?
Satya Nadella
嗯,你知道的,我是非常相信規(guī)模法則的。首先我得說,事實上,我們在 2019 年做的賭注就是基于規(guī)模法則,而且我依然堅信這一點。
換句話說,不要反對規(guī)模法則,但同時我們也要基于幾個不同的因素保持現(xiàn)實。一個是,隨著集群規(guī)模的增大,規(guī)模法則的指數(shù)增長將變得更困難,因為分布式計算問題在進行大規(guī)模訓練時會變得更加復雜。所以,這就是其中的一方面。
然而,我仍然認為,盡管如此,OpenAI 的朋友們可以代為說明他們的做法,但他們依然在繼續(xù)進行預訓練,我認為這不會停止,仍然在持續(xù)進行。
但令人興奮的是,OpenAI 曾公開談論過的,以及 Sam 也提到過的,就是他們在 0 和 1 上的工作。這個思路鏈條通過自動分級和測試推理,實際上是一個巨大的進步?;旧?,推理計算時間本身也是一種規(guī)模法則。
所以你有了預訓練,然后你有效地通過這個測試時間采樣來生成令牌,再將其送回預訓練,創(chuàng)造出更強大的模型,這些模型又可以在推理階段運行。因此,我認為這是一種極好的方法,可以提升模型的能力。
測試時間或者推理時間的計算好處在于,運行這些 O1 模型時,可能涉及兩個獨立的事情:采樣類似于訓練,使用它生成訓練用的令牌;而且客戶在使用 O1 時,實際上也在用更多的資源。所以你從中獲得了報酬。因此,這種經(jīng)濟模型是可行的。所以我覺得這是一個很好的方式。
事實上,這也是我一直說的,我在全球有 60 多個數(shù)據(jù)中心,這是一個良好的結構性優(yōu)勢。
Bill Gurley
這兩個擴展方向的硬件架構不一樣,對嗎?一個是預訓練,另一個是推理。
Satya Nadella
是的,我認為最好的理解方式是它們之間有比例關系。所以回到 Brad 所說的 ROIC,實際上這就是你必須建立一個穩(wěn)定狀態(tài)的地方。
事實上,我每次跟 Jensen 談時,他的看法都很對:你想要每年都買一些,而不是一次性購買。你想一想,當你把設備折舊周期定為 6 年時,最好的方式就是每年買一點,逐步積累,對吧?
你用領先的節(jié)點來做訓練,第二年它就進入推理階段。這就是穩(wěn)定狀態(tài)。我認為我們最終會在整個設備群體中實現(xiàn)這種穩(wěn)定狀態(tài),不僅僅是利用率,還有 ROIC。最終需求與供給會匹配。
像你提到的,大家說指數(shù)增長是否停止了,經(jīng)濟現(xiàn)實也會發(fā)生作用。到某個時候,每個人都會審視并做出經(jīng)濟上理性的決策,即便我每年都在雙倍提升能力,但如果我不能賣掉這些產(chǎn)品,那就沒意義了。
另一個問題是贏家的詛咒。你不一定需要發(fā)布論文,其他人僅僅需要看看你的能力,之后就能進行蒸餾或者其他方式復制。這就像是盜版一樣。你可以規(guī)定各種使用條款,但實際上這些東西很難控制。蒸餾就是這樣,另外,你不必做什么,只需逆向工程你的能力,并以更高效的計算方式實現(xiàn)。
因此,考慮到這一切,我認為會有一個上限,大家現(xiàn)在都在追逐一點領先,但最終所有經(jīng)濟現(xiàn)實都會顯現(xiàn)出來,網(wǎng)絡效應是在應用層。所以如果網(wǎng)絡效應都在應用層,那我為什么還要在某個模型能力上投入大量資金呢?
Brad Gerstner
我聽到你的意思是,Elon 曾說他要建一個百萬 GPU 的集群,我認為 Meta 也說過類似的話。
Bill Gurley
我記得他講的是預訓練要用 200 個,之后又開玩笑說是百萬。
Brad Gerstner
但我記得他是開玩笑說的一個十億的集群。但事實上,Satya,基于你對預訓練和擴展的看法,你是否已經(jīng)改變了你們的基礎設施規(guī)劃?
Satya Nadella
我目前的建設方式是采取一種相對接近 10x 的思路。就是說,我們可以討論周期,比如每兩年一次,每三年一次,或者每四年一次,都有一個經(jīng)濟模型。我認為這里需要一種相對有紀律的方式來思考如何清理庫存,使其變得有意義,或者你也可以從設備的折舊周期來考慮。
你不能一下子買進大量設備,除非你能找到 GPU 的物理特性能夠與我的財務狀況匹配,并且它的利潤率和超大規(guī)模運營商一樣好。簡單來說,我的做法是,繼續(xù)建立如何驅動推理需求,然后提高我的能力,并且保持高效。
我當然知道 Sam 可能有不同的目標,他對 AGI 有深刻的信念,或者其他方面有深刻的看法,那么就去做吧。所以,我認為這也是我們關注的一部分。
Bill Gurley
但我聽 Mustafa 在播客中提到,微軟不會參與當前的大型模型訓練競爭,這樣說準確嗎?
Satya Nadella
嗯,我們不會做重復的工作。畢竟,鑒于我們與 OpenAI 的合作,微軟現(xiàn)在進行第二次訓練是沒有意義的。
Bill Gurley
對,沒錯。
Satya Nadella
所以我們非常謹慎。這也是我們戰(zhàn)略上的一種紀律。實際上,這就是我一直強調給 Sam 的那點:我們把所有賭注壓在 OpenAI 上,說我們要集中計算資源,并且因為我們擁有所有 IP 權益,所以我們做了這樣的選擇,感到非常好。
因此,Mustafa 說的意思是,我們會在訓練之后,甚至在驗證等方面,集中更多資源。所以,我們會專注于添加更多模型適配和能力,同時確保我們也有原則性的預訓練工作,這樣可以使我們在內部有能力做出相應的調整。我們會繼續(xù)開發(fā)適應不同使用場景的模型權重和模型類別。
Bill Gurley
對于 Brad 提到的平衡 GPO 和 Gpuroi 的問題,你的回答是否也解釋了為什么你們會將部分基礎設施外包給 Core Weave 并建立合作伙伴關系呢?
Satya Nadella
我們之所以這么做,是因為大家都被 ChatGPT 和 OpenAI 的影響搞得措手不及。是的,完全是的。我是說,根本沒辦法進行供應鏈規(guī)劃,什么都沒法預料。二十多年前,誰能想到 2022 年 11 月發(fā)生的事呢?那簡直是晴天霹靂。所以我們不得不趕上進度。我們當時就說,不會過度擔心效率問題。所以,不論是 Core Weave 還是其他公司,我們都在各地購買。可以理解吧?這是一次性的事情,現(xiàn)在我們已經(jīng)在追趕進度了。所以,這更像是追趕的過程。
Brad Gerstner
那么現(xiàn)在你們還有供應限制嗎,Satya?
Satya Nadella
不再有芯片供應的限制了。我們在 2024 年確實經(jīng)歷了一些供應約束。我們對外宣布過,因此我們對 2025 年上半年持樂觀態(tài)度,那將是我們財年的剩余部分。之后,我認為到 2026 年,我們的狀況會更好。所以我們有很好的供應鏈。
Brad Gerstner
我聽說,關于你們在 O1、測試時間計算、后訓練工作的投入,取得了非常積極的成果。你提到的這些也非常計算密集,因為你們需要生成大量的令牌,然后將這些令牌回填到上下文窗口中,反復進行。這種計算需求會迅速累積。
Jensen 曾表示,他認為 O1 推理計算的需求會達到百萬倍甚至十億倍的增長。對于你來說,是否覺得自己有足夠的長期計劃來擴展推理計算,以跟得上這些新模型的需求呢?
Satya Nadella
是的,我認為這里有兩點需要關注,Brad。某種意義上,理解整個工作負載非常有幫助。整體工作負載中,在智能體模型的應用中,必須擁有 AI 加速器。事實上,OpenAI 自己的容器服務是增長最快的部分。
畢竟,這些智能體需要一個“臨時工作區(qū)”,用于執(zhí)行一些自動分級,甚至是生成樣本。這就是他們運行代碼解釋器的地方。順便說一下,這個就是標準的 Azure Kubernetes 集群。所以從某種角度看,常規(guī)的 Azure 計算與 GPU 的比例以及一些數(shù)據(jù)服務的比例,也可以看作是整個計算模型的一部分。
因此,回到你的問題,我們談論推理時,實際上是說這些事情的組合。正因如此,我才會認為,AI 不再是與云計算分開的領域,它現(xiàn)在已經(jīng)成為云計算的核心部分。
在每個 AI 應用都是有狀態(tài)的、智能體式的應用的時代,這些智能體執(zhí)行具體操作時,經(jīng)典的應用服務器加上 AI 應用服務器再加數(shù)據(jù)庫就是所需的一切。
所以,我回到我的基本觀點,就是我們已經(jīng)建設了 60 多個 AI 區(qū)域,所有的 Azure 區(qū)域都已經(jīng)準備好支持全面的 AI 應用。這就是未來所需的基礎設施。
Brad Gerstner
這聽起來很有道理。我們在這次對話中已經(jīng)提到了很多關于 OpenAI 的內容,但你正在管理的是你們在 OpenAI 的巨大投資與你們自身“點燃”計劃之間的平衡。你展示了一張幻燈片,突出了 Azure、OpenAI 和 OpenAI Enterprise 之間的差異,其中很多內容都涉及企業(yè)級的功能,是你們所帶來的獨特優(yōu)勢。
那么,當你看到這種競爭關系時,你是如何思考的?你是否認為 ChatGPT 在消費端可能是最終贏家?你們也會有自己的消費端應用,之后可能會在企業(yè)市場進行分工合作。你是如何看待與 OpenAI 的競爭關系的?
Satya Nadella
到目前為止,我的看法是,OpenAI 作為一個大規(guī)模的公司,它已經(jīng)不再是單純的初創(chuàng)公司了。它現(xiàn)在是一個非常成功的公司,已經(jīng)有了多個業(yè)務線和多個市場領域。
所以我從原則上來思考這個問題,就像我對待任何其他大型合作伙伴一樣,因為我不認為它們是競爭對手,我認為它們是一個投資伙伴,看看我們之間的利益如何對接。我把它們當作 IP 合作伙伴,因為我們提供系統(tǒng)的 IP,他們則提供模型的 IP。所以這也是我們相互深度關心對方成功的一個方面。
第三,我把它們當作一個大客戶來看待,因此,我希望像對待其他大客戶一樣為它們提供服務。
最后是合作。無論是消費端的 Copilot,還是與 M365 等產(chǎn)品的合作,我們都會在這里進行深入合作。所以,我看待這種競爭時,最終這些領域會有一些重疊。但在這個背景下,OpenAI 擁有蘋果的合作協(xié)議,從某種角度來看,對微軟股東來說,實際上是創(chuàng)造價值的。
就像你提到的 API 差異,客戶可以根據(jù)自己的需要選擇使用。比如,如果你是 Azure 的客戶并且想使用 Azure 的其他服務,那么使用 Azure 的 API 和相關服務會更方便。但如果你在 AWS 上,只需要簡單地使用 API,無狀態(tài)的使用 OpenAI 也很不錯。所以,從某種意義上講,擁有這兩種分發(fā)方式對微軟來說也是有利的。
Bill Gurley
可以說,這確實是硅谷社區(qū),甚至更廣泛的商業(yè)社區(qū)中一個頗具吸引力的話題。我想,微軟與 OpenAI 之間的關系一直是人們關注的焦點。我上周末在 Dealbook 上聽到 Andrew Sorkin 強烈追問 Sam 對這個問題的看法。
雖然有很多事情可能你不能透露,但你能透露點什么嗎?關于 OpenAI 是否正在進行重組,是否有轉換為盈利模式的計劃?我猜 Elon 也在其中發(fā)表了一些意見。你能分享一些情況嗎?
Satya Nadella
嗯,我認為這些問題當然要由 OpenAI 的董事會、Sam、Sarah 和 Brad 他們團隊來決定,他們會根據(jù)自己的判斷做出選擇,而我們會提供支持。從我們的角度來看,我們深切關心的,首先是 OpenAI 繼續(xù)成功,因為這對我們有利。我也認為 OpenAI 是這個平臺轉型中的標志性公司,世界因 OpenAI 的成功而變得更好。所以這是我們基本的立場。
接下來的問題,是你提到的那種緊張局勢。就像在所有這種合作關系中,一部分是合作的緊張,另一部分則是 Sam 作為一個極具遠見和雄心的企業(yè)家,他有著非常明確的目標和行動速度。他的節(jié)奏很快,所以我們需要平衡這一點。
這也意味著我們需要在我們自己的約束條件下,去理解和支持他所要做的事,而他也需要理解和適應我們在一些方面所需要的紀律。所以我相信我們會找到平衡點。
但是我覺得好消息是,我們在這個合作框架內已經(jīng)走了很長的路。過去五年對他們和對我們都非常好。而從我的角度來看,我會繼續(xù)堅持這一點,并希望能盡可能延續(xù)這種合作關系。我們只有長期穩(wěn)定的合作伙伴關系,才能使雙方受益。
Brad Gerstner
當你們考慮到獨立融資、解開兩家公司之間的聯(lián)系時,你們是否打算盡快推進?我曾經(jīng)提到,或許下一步,OpenAI 對他們來說,最好的發(fā)展路徑就是成為一家上市公司。畢竟,AI 領域的領頭羊,具有如此標志性的業(yè)務,這對他們的未來發(fā)展有著積極的影響。你怎么看待這種可能性?你認為 OpenAI 未來的發(fā)展會繼續(xù)保持目前的合作關系嗎,還是會有更大的變動?
Satya Nadella
我想我要小心,不要越過界限。因為從某種意義上說,我們并不是 OpenAI 的董事會成員,我們只是投資者,像你們一樣。最終,這些決定由他們的董事會和管理層做出。所以在某種程度上,我會根據(jù)他們的判斷來做出反應。
換句話說,我非常明確的是,我們希望支持他們所做出的任何決定。對我來說,作為投資者,最重要的是我們之間的商業(yè)合作和知識產(chǎn)權伙伴關系。我們需要確保在這個過程中保護好我們的利益,并在未來不斷強化這些合作。
但我認為,像 Sarah、Brad 和 Sam 這樣的聰明人,他們會做出最符合他們使命目標的決定。我們也會支持他們在這一過程中做出的決策。
Brad Gerstner
那么,也許我們該結束了。非常感謝你今天的時間。我想以“開放”與“封閉”的話題來做一個總結,談談我們如何合作來確保 AI 的安全性。或許我可以給你一個開放式的問題,談談你如何看待開放源代碼和封閉源代碼之間的區(qū)別,以及在推動安全 AI 時的合作。
這里有一個例子,路透社最近報道了中國研究人員在 Meta 的 Llama 模型基礎上開發(fā)了一個 AI 模型,可能會被用于軍事用途。很多像 Bill 和我這樣支持開源的人,也聽到了一些批評聲音。
而你也提到過,大家可以提取模型進行訓練,最終一些模型的應用可能是我們不愿意看到的。那你如何看待,如何作為一個國家,作為一群公司共同推動安全的 AI 發(fā)展呢?
Satya Nadella
我認為這個問題有兩個方面。首先,我一直認為開放源代碼和封閉源代碼是創(chuàng)建網(wǎng)絡效應的兩種不同途徑。我從來沒有把它們看作是單純的“宗教戰(zhàn)斗”,而是更多地從商業(yè)戰(zhàn)略的角度來看待它們,認為它們是兩種不同的選擇。
這也是為什么我認為 Meta 和 Mark 所做的事情非常聰明。某種意義上,他試圖將自己的優(yōu)勢進行商品化。這對我來說非常有道理,如果我是 Meta 的話,我也會這么做。他很公開、也非常有說服力地談到,自己想讓 Meta 成為 LLM(大語言模型)的“Linux”。
我覺得這是一個非常美妙的模型,事實上,這里確實有一個潛在的商業(yè)模式。而且從經(jīng)濟學的角度來看,我認為,理論上一個由多個參與方共同推動的聯(lián)盟,可能比任何一個單獨的企業(yè)來做這件事更好。比如說,在 Linux 基金會下,貢獻者的主要資金來源是運營支出。
我一直說,Linux 能夠成功,不僅僅是因為它本身的開源精神,也離不開像微軟、IBM、Oracle 等公司的支持。開放源代碼為這種合作提供了很好的機制,而封閉源代碼則在其他方面可能更具優(yōu)勢。
至于封閉源代碼,我們也經(jīng)歷了很多成功的封閉源產(chǎn)品。至于安全性,這是一個非常重要的問題,但它是一個獨立的問題。畢竟,法律和安全標準都適用于所有產(chǎn)品,不論是開源還是封閉源。
所以,我認為在資本主義體系下,最好是保持多種商業(yè)模式并允許競爭,讓不同的公司選擇適合自己的路徑。而政府也應該對此進行嚴格的監(jiān)管。
至于 AI 的安全性,毫無疑問,不能再等待所謂的“看后果”了。沒有任何政府、社區(qū)或社會能夠容忍這種態(tài)度。因此,這些 AI 安全機構會對所有模型設定統(tǒng)一的標準。如果存在國家安全泄漏問題,大家也會對此非常關注。所以,我認為各國政府和國家政策將對這些模型的發(fā)展產(chǎn)生重要影響,監(jiān)管制度也會相應制定。
Brad Gerstner
真的很難相信我們已經(jīng)進入 ChatGPT 時代僅僅 22 個月了?;仡^看看,你關于階段性轉型的框架,微軟無疑處于一個非常有利的位置,隨著我們進入 AI 時代。所以,過去 10 年的表現(xiàn)非常值得祝賀,真的是令人矚目。
與此同時,我覺得,Bill 和我看到你、Elon、Mark、Sundar 等人的領導力時,都會感到非常激動,因為你們確實在推動“美國團隊”在 AI 領域的前進。我們倆都對未來如何在全球范圍內定位自己充滿了信心。所以,非常感謝你花時間與我們交流。
本文由人人都是產(chǎn)品經(jīng)理作者【江天 Tim】,微信公眾號:【有新Newin】,原創(chuàng)/授權 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評論,等你發(fā)揮!