OpenAI在國(guó)內(nèi)的兩條應(yīng)用之路走不通了?

0 評(píng)論 1728 瀏覽 0 收藏 12 分鐘

OpenAI即將停止為中國(guó)大陸提供API服務(wù),可能導(dǎo)致中國(guó)企業(yè)和服務(wù)提供商轉(zhuǎn)向國(guó)產(chǎn)大模型。

接到奧特曼警告信的第一時(shí)間,專注出海電商服務(wù)的大模型領(lǐng)域創(chuàng)業(yè)者高瑞麟,緊急召開(kāi)了一場(chǎng)辦公會(huì),商討是否需要將公司業(yè)務(wù)遷移到國(guó)產(chǎn)大模型上去的棘手問(wèn)題。

“遷移,(擔(dān)心)用戶會(huì)不會(huì)繼續(xù)買賬;不遷移,繼續(xù)(調(diào)用OpenAI API)的話,成本、合規(guī)風(fēng)險(xiǎn)等都在提高?!?/p>

令高瑞麟陷入兩難的,是在奧特曼領(lǐng)導(dǎo)下的OpenAI的一封推送郵件。在6月25日發(fā)出的郵件中,OpenAI表示,從今年7月9日開(kāi)始,將阻止來(lái)自非支持國(guó)家和地區(qū)的API(應(yīng)用程序接口)服務(wù)。受影響組織若希望繼續(xù)使用OpenAI的服務(wù),必須在其支持的國(guó)家或地區(qū)內(nèi)訪問(wèn)。

這也意味著,不在支持地區(qū)范圍內(nèi)的中國(guó)大陸,將迎接OpenAI的“斷供”風(fēng)險(xiǎn)。需要注意的是,ChatGPT爆紅以來(lái),OpenAI其實(shí)一直未曾開(kāi)放過(guò)中國(guó)市場(chǎng)的服務(wù)。

國(guó)內(nèi)大模型創(chuàng)業(yè)者李振告訴字母榜,當(dāng)前國(guó)內(nèi)想要訪問(wèn)OpenAI的API,一般有兩個(gè)途徑:一是直接向OpenAI官方申請(qǐng),這種方式更多適合個(gè)人開(kāi)發(fā)者;二是通過(guò)采購(gòu)微軟云服務(wù),間接接入OpenAI服務(wù),這也是當(dāng)前國(guó)內(nèi)唯一的合規(guī)渠道。據(jù)李振觀察,目前微軟云提供的OpenAI接入服務(wù)仍可以正常訪問(wèn)。

通過(guò)上述兩種途徑,圍繞OpenAI的API,國(guó)內(nèi)大模型玩家也由此發(fā)展出了兩大應(yīng)用場(chǎng)景:科技大廠用以幫助訓(xùn)練自己的大模型,在模仿的基礎(chǔ)上追求趕超效果;中小企業(yè)則用來(lái)開(kāi)發(fā)落地應(yīng)用,在實(shí)際使用中向客戶提供多樣性選擇。

對(duì)于更有實(shí)力和資源的大模型玩家而言,即便“斷供”政策正式生效,也可能擋不住它們繼續(xù)調(diào)用OpenAI的API的行為,“在一個(gè)全球化的市場(chǎng)中,很難存在徹底隔斷某一地區(qū)訪問(wèn)權(quán)限的可能性,就是需要穿越多少圍欄的問(wèn)題。”關(guān)注大模型投資的恒業(yè)資本創(chuàng)始合伙人江一說(shuō)道。

01

進(jìn)入2024年,即便已經(jīng)出現(xiàn)了一眾號(hào)稱性能媲美GPT-4級(jí)別的國(guó)產(chǎn)基礎(chǔ)大模型,但調(diào)用OpenAI技術(shù)的需求仍然存在。

在江一接觸到的合作客戶中,有人明確提出希望提供OpenAI技術(shù)選項(xiàng),“面對(duì)更開(kāi)放、更發(fā)散性的問(wèn)答時(shí),OpenAI展現(xiàn)出來(lái)的答案還是更強(qiáng)一些?!?/p>

這也促使一些應(yīng)用開(kāi)發(fā)商對(duì)不同的模型做起人為分割,簡(jiǎn)單的問(wèn)題推理,以及涉及垂類行業(yè)問(wèn)答的場(chǎng)景,優(yōu)先調(diào)用國(guó)內(nèi)大模型,偏復(fù)雜推理和分析的內(nèi)容,就交給OpenAI。

具體運(yùn)行環(huán)節(jié),有點(diǎn)類似當(dāng)前業(yè)內(nèi)推崇的MoE混合專家模型邏輯,當(dāng)客戶提出一個(gè)問(wèn)題后,借助機(jī)器學(xué)習(xí)的匹配算法,先將問(wèn)題分類,從而基于分類結(jié)果匹配對(duì)應(yīng)的模型服務(wù)商。但是否使用OpenAI服務(wù),還取決于客戶是否愿意為此多花錢,“充什么樣的會(huì)員套餐,給你供應(yīng)什么樣的大模型選擇范圍。”李振解釋道。

不同于應(yīng)用開(kāi)發(fā)者的具體使用需求,那些同樣有著自研大模型野心的國(guó)內(nèi)廠商,通過(guò)接入OpenAI技術(shù),還能起到輔助刷榜的作用。

知名大模型測(cè)試集C-Eval就曾在官網(wǎng)置頂聲明,稱評(píng)估永遠(yuǎn)不可能是全面的,任何排行榜都可能以不健康的方式被黑客入侵,并給出了幾種常見(jiàn)的刷榜手法,如對(duì)強(qiáng)大的模型(例如GPT-4)的預(yù)測(cè)結(jié)果蒸餾、找人工標(biāo)注然后蒸餾、在網(wǎng)上找到原題加入訓(xùn)練集中微調(diào)模型等等。

站在OpenAI的肩膀上,從模仿借鑒中快速趕超,則是國(guó)內(nèi)大模型玩家接入OpenAI技術(shù)的更重要目的。

去年12月份,字節(jié)跳動(dòng)被爆出正在研發(fā)一個(gè)名為“種子計(jì)劃”(Project Seed)的AI大模型項(xiàng)目,但該項(xiàng)目在訓(xùn)練和評(píng)估模型等多個(gè)研發(fā)階段調(diào)用了OpenAI的API,并使用ChatGPT輸出的數(shù)據(jù)進(jìn)行模型訓(xùn)練。

此舉違反了OpenAI的使用協(xié)議,根據(jù)規(guī)則,OpenAI禁止使用輸出開(kāi)發(fā)競(jìng)爭(zhēng)模型。因此,字節(jié)旗下部分GPT使用權(quán)限被OpenAI封禁。

字節(jié)官方坦陳,內(nèi)部技術(shù)團(tuán)隊(duì)剛開(kāi)始進(jìn)行大模型的初期探索時(shí),確實(shí)有部分工程師將ChatGPT的API服務(wù)應(yīng)用于較小模型的實(shí)驗(yàn)性項(xiàng)目研究中,但“該模型僅為測(cè)試,沒(méi)有計(jì)劃上線,也從未對(duì)外使用?!?/p>

部分國(guó)產(chǎn)大模型在訓(xùn)練模型速度上快速起步的一大原因,同樣離不開(kāi)對(duì)國(guó)外大模型的借鑒。去年11月被傳出套殼消息時(shí),零一萬(wàn)物在回應(yīng)字母榜中承認(rèn),在訓(xùn)練模型過(guò)程中,沿用了 GPT/LLaMA的基本架構(gòu),但需要說(shuō)明的是,借鑒架構(gòu)并不能跟“套殼”或者“抄襲”直接劃等號(hào)。

不過(guò),這確實(shí)幫助零一萬(wàn)物縮短了模型研發(fā)時(shí)間。去年3月,李開(kāi)復(fù)正式宣布將親自帶隊(duì),成立一家AI 2.0公司,研發(fā)通用大模型。經(jīng)過(guò)三個(gè)月籌辦期,同年7月份,該公司正式定名“零一萬(wàn)物”,并組建起數(shù)十人的大模型研發(fā)團(tuán)隊(duì)。團(tuán)隊(duì)成型四個(gè)月后,零一萬(wàn)物便在11月份推出了“Yi”系列大模型產(chǎn)品,并借助Yi-34B霸榜多個(gè)大模型測(cè)試集。

02

在OpenAI“斷供”危機(jī)之下,國(guó)產(chǎn)大模型的戰(zhàn)略替代價(jià)值越發(fā)凸顯。在李振看來(lái),從經(jīng)濟(jì)賬上考量,國(guó)內(nèi)公司直接調(diào)用國(guó)產(chǎn)大模型會(huì)是更為劃算的選擇。

搶在企業(yè)遷移之前,一些追求更高收益的個(gè)人開(kāi)發(fā)者,已經(jīng)率先用國(guó)產(chǎn)模型替換掉了OpenAI。

2022年11月ChatGPT亮相后,受限于政策,一些人開(kāi)始盯上國(guó)內(nèi)想要嘗鮮的用戶,做起了賣號(hào)生意。當(dāng)時(shí),ChatGPT Plus官方訂閱價(jià)格為一個(gè)月20美元,國(guó)內(nèi)用戶想要使用,收費(fèi)一般為共享號(hào)(供4-6個(gè)人使用)一個(gè)月50元左右,獨(dú)享號(hào)一個(gè)月170元左右。

但從2023年下半年開(kāi)始,隨著越來(lái)越多國(guó)產(chǎn)大模型的發(fā)布,加上用戶對(duì)ChatGPT新鮮感的減弱,越來(lái)越多個(gè)人開(kāi)發(fā)者已經(jīng)將技術(shù)底座從OpenAI換成了國(guó)產(chǎn)平替,訂閱價(jià)格也隨之下降,有的連續(xù)包年僅需198元。

現(xiàn)在,在App Store應(yīng)用商店中搜索“ChatGPT”,各類相似應(yīng)用程序充斥其中,ChatGtp4o、ChatGp4、ChatGp4o、ChatBPT 4.0、ChatGTB4……

如今,OpenAI的“斷供”之舉,給國(guó)產(chǎn)大模型廠商提供了一次搶奪中小企業(yè)用戶的遷移機(jī)會(huì)。

繼5月份字節(jié)、阿里、百度、騰訊等掀起大模型價(jià)格戰(zhàn)之外,從6月25日開(kāi)始,一眾國(guó)產(chǎn)大模型玩家又紛紛祭出了零成本遷移計(jì)劃,再次加碼性價(jià)比之戰(zhàn)。

截至目前,包括智譜AI、百度、阿里、騰訊、百川智能、零一萬(wàn)物、商湯科技、月之暗面等均已推出了OpenAI零成本遷移計(jì)劃。為加速用戶“搬家”,部分國(guó)產(chǎn)大模型還額外附送1千萬(wàn)乃至1億Tokens,并配套調(diào)用、遷徙、訓(xùn)練等多項(xiàng)免費(fèi)服務(wù)大禮包。

03

便宜,只是鼓動(dòng)用戶遷移的必要條件。想要真正贏得用戶的青睞,國(guó)產(chǎn)大模型還需要做到更好用。

去年曾喊出史上最大降價(jià)的阿里云,并未能借助價(jià)格戰(zhàn)換來(lái)新的增長(zhǎng)。聚焦到國(guó)內(nèi)公有云市場(chǎng),阿里云市場(chǎng)份額不增反減。IDC發(fā)布的《中國(guó)公有云服務(wù)市場(chǎng)(2023下半年)跟蹤》報(bào)告顯示,2023下半年IaaS市場(chǎng)中,阿里云市場(chǎng)占比27.1%,位居第一。但在2023上半年中國(guó)IaaS市場(chǎng)中,阿里云市場(chǎng)份額則為29.9%。

更可況,在國(guó)產(chǎn)大模型降價(jià)的同時(shí),OpenAI們也在降價(jià)。按奧特曼的話說(shuō),“OpenAI也可以將非常高質(zhì)量的AI技術(shù)成本降至接近零……”

想要增強(qiáng)大模型底座的產(chǎn)品吸引力,除了價(jià)格之外,更重要的比拼則在數(shù)據(jù)端。

2020年發(fā)布GPT-3時(shí),OpenAI曾詳細(xì)公開(kāi)了模型訓(xùn)練的所有技術(shù)細(xì)節(jié)。中國(guó)人民大學(xué)高瓴人工智能學(xué)院執(zhí)行院長(zhǎng)文繼榮表示,國(guó)內(nèi)很多大模型其實(shí)都有GPT-3的影子。但隨著OpenAI在GPT-4上一改開(kāi)源策略,逐漸走向封閉,一些國(guó)產(chǎn)大模型就此失去了可供復(fù)制的追趕路徑。

此后,各家大模型拉開(kāi)技術(shù)差距的重點(diǎn),越來(lái)越多體現(xiàn)在訓(xùn)練方法、數(shù)據(jù)配比、數(shù)據(jù)工程、細(xì)節(jié)參數(shù)、訓(xùn)練過(guò)程監(jiān)測(cè)技巧等細(xì)節(jié)之中。

即便在模型框架相同之下,不同的數(shù)據(jù)來(lái)源和數(shù)據(jù)訓(xùn)練方法加持下,最終訓(xùn)練出來(lái)的大模型性能依然會(huì)表現(xiàn)各異?!扒按竽P蜁r(shí)代,AI的主流是以模型為中心的單任務(wù)系統(tǒng),數(shù)據(jù)基本保持不變。進(jìn)入大模型時(shí)代,算法基本保持恒定,而數(shù)據(jù)在不斷增強(qiáng)增大。”在產(chǎn)業(yè)專家劉飛看來(lái),相比算法和算力,數(shù)據(jù)可能是眼下阻礙國(guó)產(chǎn)大模型追趕OpenAI步伐的更大鴻溝,“魔鬼都藏在這些數(shù)據(jù)訓(xùn)練的細(xì)節(jié)里?!?/p>

在國(guó)內(nèi)大模型紛紛跨入萬(wàn)億參數(shù)時(shí)代之后,對(duì)數(shù)據(jù)采集和訓(xùn)練的能力考驗(yàn)再次提升。參數(shù)量的大小與最終模型呈現(xiàn)的效果之間,兩者“投入產(chǎn)出并不成正比,而是非線性的?!眲w表示,“數(shù)據(jù)多只是一個(gè)定性,更重要的是考驗(yàn)團(tuán)隊(duì)數(shù)據(jù)清洗的能力,否則隨著數(shù)據(jù)增多,數(shù)據(jù)干擾也將隨之變大?!?/p>

本文由人人都是產(chǎn)品經(jīng)理作者【字母榜】,微信公眾號(hào):【字母榜】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!