9 月 19 日,國(guó)際數(shù)據(jù)公司(IDC)發(fā)布了一份名為《中國(guó)大模型公有云服務(wù)市場(chǎng)分析,2025H1》的調(diào)研報(bào)告,其中披露了當(dāng)前中國(guó) AI 產(chǎn)業(yè)發(fā)展速度的核心數(shù)據(jù),值得關(guān)注。
報(bào)告顯示,2025 年上半年,中國(guó)公有云上大模型調(diào)用量(統(tǒng)計(jì)口徑為云廠商對(duì)外部客戶提供的服務(wù),不含自有業(yè)務(wù))達(dá) 536.7 萬(wàn)億 Tokens,較 2024 年全年 114 萬(wàn)億 Tokens 的規(guī)模增長(zhǎng)近 400%。
市場(chǎng)格局方面,火山引擎以 49.2% 的份額位居第一,接近半壁江山,延續(xù)并擴(kuò)大了 2024 年 46.4% 的領(lǐng)先優(yōu)勢(shì)。阿里云百煉平臺(tái)則以 27.0% 的市場(chǎng)占比排名第二,第三是百度智能院千帆平臺(tái),占比 17.0%。

IDC 在報(bào)告中同時(shí)指出,中國(guó)大模型公有云服務(wù)市場(chǎng)未來(lái)仍有數(shù)百倍增長(zhǎng)空間,但當(dāng)前面臨的核心瓶頸是如何打破泛互聯(lián)網(wǎng)行業(yè)局限,向更多傳統(tǒng)行業(yè)滲透;此外,市場(chǎng)已從側(cè)重模型訓(xùn)練顯著向模型推理服務(wù)遷移,多模態(tài)大模型與 Agent 應(yīng)用成為增長(zhǎng)關(guān)鍵驅(qū)動(dòng)力,并建議行業(yè)需從“量”向“質(zhì)”突破,以應(yīng)用生態(tài)塑造差異化,同時(shí)推動(dòng)低碼與高碼開(kāi)發(fā)模式融合。
兩大增長(zhǎng)拐點(diǎn)揭示行業(yè)邏輯:為何 Token 成 AI 應(yīng)用核心標(biāo)尺?
仔細(xì)看 IDC 的報(bào)告,可以發(fā)現(xiàn)一些有意思的現(xiàn)象。比如在報(bào)告中關(guān)于“中國(guó)公有云大模型調(diào)用量月度環(huán)比增長(zhǎng)”的統(tǒng)計(jì)曲線中,能夠清晰發(fā)現(xiàn)兩個(gè)改變行業(yè)增長(zhǎng)格局的關(guān)鍵拐點(diǎn),而這兩個(gè)節(jié)點(diǎn)背后,恰好是 Token 成為 AI 應(yīng)用核心衡量指標(biāo)的深層邏輯所在。

第一個(gè)拐點(diǎn)是 2024 年 7 月,這個(gè)月的中國(guó)大模型公有云服務(wù) YoY 增長(zhǎng)率超過(guò) 160%。而這個(gè)時(shí)間點(diǎn),恰好是豆包大模型技術(shù)降本全面發(fā)酵之后。在這之前的 2024 年 5 月 15 日,豆包大模型通過(guò)模型架構(gòu)、推理框架等技術(shù)創(chuàng)新,將主力模型定價(jià)直接從行業(yè)的“分計(jì)價(jià)”拉入“厘計(jì)價(jià)”時(shí)代,降幅高達(dá) 99.3% 。

第二個(gè)拐點(diǎn)出現(xiàn)在 2025 年 2 月,這個(gè)月的增長(zhǎng)幅度達(dá)到 60% 的水平。而這個(gè)時(shí)間點(diǎn),對(duì)應(yīng)的是行業(yè)事件是 DeepSeek-R1 推理模型爆紅。
這一事件不僅加速了 MaaS 市場(chǎng)滲透率,更標(biāo)志著中國(guó) AI 云市場(chǎng)正式從“預(yù)訓(xùn)練時(shí)代”邁向“推理時(shí)代”。IDC 報(bào)告明確指出,此時(shí)市場(chǎng)需求已完成從模型訓(xùn)練向推理服務(wù)的遷移,企業(yè)對(duì)推理的關(guān)注重點(diǎn)從“準(zhǔn)確性”擴(kuò)展到“資源效率、運(yùn)營(yíng)成本與可持續(xù)發(fā)展”,而推理場(chǎng)景的核心衡量單位,正是 Token 消耗量。
透過(guò)這兩個(gè)拐點(diǎn),我們也能一窺當(dāng)前 AI 模型產(chǎn)業(yè)發(fā)展的底層邏輯和趨勢(shì)。
首先值得注意的是,IDC 此次選擇以“Tokens 調(diào)用量”作為核心統(tǒng)計(jì)指標(biāo),而非傳統(tǒng)的 IaaS(算力、存儲(chǔ))或 PaaS(開(kāi)發(fā)平臺(tái))打包統(tǒng)計(jì),本質(zhì)就是抓住了 AI 應(yīng)用落地的“真實(shí)標(biāo)尺。
從統(tǒng)計(jì)邏輯看,IaaS 統(tǒng)計(jì)的是“算力供給”,而非“算力使用”—— 部分云廠商通過(guò)低價(jià)銷售 GPU 資源沖營(yíng)收,但大量算力處于閑置狀態(tài),無(wú)法反映 AI 應(yīng)用的實(shí)際落地情況;而 Token 統(tǒng)計(jì)的是“模型實(shí)際調(diào)用”,每一個(gè) Token 都對(duì)應(yīng)一次文本生成、圖像分析或語(yǔ)音交互,是 AI 與業(yè)務(wù)場(chǎng)景結(jié)合的直接體現(xiàn)。以火山引擎為例,IDC 統(tǒng)計(jì)未包含其自有業(yè)務(wù)(如抖音、豆包 APP)的 Token 消耗,若納入統(tǒng)計(jì),其份額將進(jìn)一步擴(kuò)大,這種“剔除水分”的統(tǒng)計(jì)方式,更能反映商業(yè)市場(chǎng)的真實(shí)需求。
從產(chǎn)業(yè)價(jià)值看,Token 消耗量是衡量 AI 產(chǎn)業(yè)景氣度的“晴雨表”。
原因有三。其一,Token 增長(zhǎng)與應(yīng)用落地強(qiáng)綁定。只有模型足夠好用、應(yīng)用場(chǎng)景足夠豐富,企業(yè)才會(huì)持續(xù)調(diào)用 —— 火山引擎數(shù)據(jù)顯示,其服務(wù)的消費(fèi)電子行業(yè)客戶引入視覺(jué)理解模型后,5 個(gè)月內(nèi) Token 消耗增長(zhǎng) 12 倍,日均突破百億 Tokens,這正是應(yīng)用落地的直接反饋。
其二,Token 模式更具可持續(xù)性。傳統(tǒng)“賣算力”是一次性交易,低價(jià)沖量無(wú)異于“飲鴆止渴”,客戶一旦發(fā)現(xiàn)算力閑置便會(huì)退租;而“賣 Token”是經(jīng)常性收入,依賴客戶持續(xù)使用,倒逼廠商優(yōu)化模型能力與服務(wù)體驗(yàn),形成“模型更好 → 應(yīng)用更多 → Token 增長(zhǎng) → 模型迭代”的良性循環(huán)。
其三,Token 具備指數(shù)級(jí)增長(zhǎng)潛力。國(guó)家數(shù)據(jù)局?jǐn)?shù)據(jù)顯示,2024 年初中國(guó)日均 Token 消耗量為 1000 億,2025 年 6 月已突破 30 萬(wàn)億,一年半增長(zhǎng) 300 倍;某 ICT 硬件企業(yè)通過(guò)敏感性測(cè)試預(yù)測(cè),若 Token 價(jià)格維持當(dāng)前水平,火山引擎未來(lái) 1-2 年 Token 調(diào)用收入或增長(zhǎng)至百億元 —— 這種增長(zhǎng)速度遠(yuǎn)超傳統(tǒng) IaaS(年增速 50%-200%),成為 AI 云市場(chǎng)的核心增量。
火山引擎的 MaaS 突圍:戰(zhàn)略、技術(shù)與規(guī)模的三重優(yōu)勢(shì)
在 MaaS 賽道的競(jìng)速中,火山引擎并非最早入局者,卻能快速占據(jù) 49.2% 的市場(chǎng)份額,核心源于其在戰(zhàn)略、技術(shù)與規(guī)模上的三重差異化優(yōu)勢(shì)。
火山引擎入局云計(jì)算市場(chǎng)較晚,若按傳統(tǒng) IaaS 模式追趕難度極大。火山引擎總裁譚待曾透露,管理層早年曾要求團(tuán)隊(duì)思考“2030 年的云與 2020 年有何不同”,最終答案是“AI”,而 MaaS 正是 AI 云的核心載體。
與其他云廠商側(cè)重 IaaS 營(yíng)收不同,火山引擎從 2024 年起就將 MaaS 置于戰(zhàn)略高度,投入遠(yuǎn)超當(dāng)前營(yíng)收規(guī)模的資源。這種戰(zhàn)略定力在 2024 年 5 月的降本中尤為明顯,每一次動(dòng)作都精準(zhǔn)踩中行業(yè)拐點(diǎn)。
在技術(shù)方面,火山引擎的技術(shù)優(yōu)勢(shì)體現(xiàn)在“模型”與“平臺(tái)”兩大維度:在模型層面,豆包大模型家族迭代速度領(lǐng)先行業(yè),目前已覆蓋文本、圖像、音頻、視頻等多模態(tài)領(lǐng)域。國(guó)際評(píng)測(cè)機(jī)構(gòu) Artificial Analysis 數(shù)據(jù)顯示,豆包?圖像創(chuàng)作模型 Seedream 4.0 的文生圖能力位居全球第一,圖像編輯能力全球第二;豆包?視頻生成模型 Seedance 1.0 pro 登頂相關(guān)盲測(cè)榜單;其實(shí)時(shí)語(yǔ)音模型更是在 C 端場(chǎng)景爆火,支持唱歌、辯論等多樣化交互,2025 年 5 月豆包大模型日均 Token 調(diào)用量達(dá) 16.4 萬(wàn)億,較 2024 年 5 月的 1200 億增長(zhǎng) 137 倍。

在平臺(tái)層面,火山引擎 MaaS 平臺(tái)“火山方舟”經(jīng)過(guò)內(nèi)部海量業(yè)務(wù)打磨,性能優(yōu)勢(shì)顯著。AI 基礎(chǔ)設(shè)施創(chuàng)業(yè)公司 TensorChord 2025 年 3 月評(píng)測(cè)顯示,火山方舟上的 DeepSeek-R1 模型每秒 Token 輸出量是部分廠商的 2.6 倍,在首字延遲、并發(fā)處理、資源利用率等客戶可感知指標(biāo)上均為行業(yè)領(lǐng)先 —— 這源于其底層技術(shù)優(yōu)化,包括 PD 分離架構(gòu)、KV-Cache 緩存加速、自研 vRDMA 網(wǎng)絡(luò)等,能“榨干每一張 GPU 的 Token 輸出潛力”。
最后是規(guī)模的支撐。火山引擎的規(guī)模優(yōu)勢(shì)來(lái)自字節(jié)跳動(dòng)“內(nèi)外同源”的技術(shù)體系 —— 支撐火山引擎外部客戶的基礎(chǔ)設(shè)施團(tuán)隊(duì),與服務(wù)抖音、飛書、廣告等內(nèi)部海量業(yè)務(wù)的團(tuán)隊(duì)是同一團(tuán)隊(duì)。這種架構(gòu)意味著,火山引擎在服務(wù)外部客戶前,已在內(nèi)部“實(shí)戰(zhàn)”中驗(yàn)證了技術(shù)的穩(wěn)定性與 scalability:例如,其需支撐抖音推薦系統(tǒng)的超大規(guī)模稀疏模型訓(xùn)練,這種能力外化后,可輕松滿足外部企業(yè)的高并發(fā) Token 調(diào)用需求。
目前,火山引擎已服務(wù)全球 9 家 Top10 手機(jī)廠商、8 成主流汽車品牌(如奔馳、寶馬、特斯拉)、70% 的系統(tǒng)重要性銀行(如招商銀行、浦發(fā)銀行)以及超五成 985 高校(如北京大學(xué)、浙江大學(xué)),這些跨行業(yè)客戶的持續(xù)調(diào)用,進(jìn)一步鞏固了其 Token 規(guī)模優(yōu)勢(shì)。
結(jié)語(yǔ)
IDC 的報(bào)告不僅是對(duì)過(guò)去市場(chǎng)格局的總結(jié),更是對(duì)未來(lái)趨勢(shì)的預(yù)言。隨著多模態(tài)技術(shù)和 Agent 應(yīng)用的成熟,單個(gè)任務(wù)消耗的 Token 量將呈幾何級(jí)數(shù)增長(zhǎng),AI 應(yīng)用的想象空間將被徹底打開(kāi)。
在這場(chǎng)變革中,誰(shuí)能提供效果最好、成本最低、性能最強(qiáng)的模型服務(wù),誰(shuí)就能吸引最多的開(kāi)發(fā)者,催生最繁榮的應(yīng)用生態(tài),從而在“Tokens 經(jīng)濟(jì)”的浪潮中占據(jù)主導(dǎo)地位。
火山引擎憑借其在 MaaS 賽道上的戰(zhàn)略定力、技術(shù)積累和規(guī)模優(yōu)勢(shì),已經(jīng)搶得先機(jī)。49.2% 的市場(chǎng)份額不僅是一個(gè)數(shù)字,更是市場(chǎng)對(duì)其戰(zhàn)略和執(zhí)行力投出的信任票,預(yù)示著在即將到來(lái)的 AI 應(yīng)用大爆發(fā)時(shí)代,它將扮演更加重要的角色。