華爾街激辯「Token經濟學」:AI賬單失控了嗎?

本篇文章深入探討了華爾街對於「Token經濟學」的熱烈討論,以及AI發展中成本與效率所帶來的深遠影響。文章指出,近期Token價格指數的連續下跌,引發了華爾街對AI帳單可能失控的擔憂。摩根大通(JPMorgan Chase)認為這僅是「最小減速帶」,但Citadel證券則直言,AI落地(實際應用)的核心重點已從「模型能力最強」轉變為「成本與稀缺性」。此篇文章強調,使用者正加速轉向較為廉價的AI模型,這將直接重塑輝達(NVIDIA)、雲端服務供應商乃至整個AI硬體產業鏈的估值邏輯。文章中引用的Token指數圖,衡量的是市場對於每百萬枚Token的平均支付意願,也就是市場願意為AI「付出多少錢」的指標。儘管該指數在過去幾個月持續攀升,但在最近卻急劇下滑,這促使市場重新評估企業對GPU、DRAM、資料中心及雲端服務的資本支出預期。美國宏觀策略師Andreas Steno Larsen更直接指出,若Token定價持續疲軟,可能導致本輪週期中記憶體到更廣泛的硬體及資料中心相關交易的結束。然而,此篇文章也提醒,Token定價走弱並非單純代表AI需求見頂,而是反映出用戶行為模式的轉變。

文章進一步闡釋了Token指數下跌背後的多重意義。它並非單純地表示「AI沒人用」,而是衡量了每百萬Token的加權平均價格,意即它反映了使用者正在採用何種價位的模型。舉例說明,若前沿模型每百萬Token費用為10美元,而廉價模型為1美元,即使整體需求翻倍,但若新增使用量主要來自廉價模型,指數反而會腰斬。這意味著指數下跌可能有兩種截然不同的解釋:一是需求真的在萎縮,二是用量在爆炸性增長,但使用者主動轉向低價模型。文章指出,這正是目前爭論的核心。Citadel證券在《Tokenomics》報告中明確指出,AI落地的核心限制已從「模型能力」轉向「成本與算力稀缺」,使用者正加速遷移至廉價模型。文中引述Citadel的說法:「採用趨勢越來越不取決於前沿模型的功能,而更多取決於價格…Token指數的近期下跌可能反映了這種向更便宜模型轉變的部分跡象。」摩根大通的分析師Mark Schilsky則認為,儘管市場出現「AI帳單失控」的討論,但這僅是「通往更高支出的最小減速帶」。整體而言,此篇文章的核心觀點是,AI技術的實際應用已不再僅限於模型本身的強大功能,更在於實現規模化AI運行所需的投入品的價格與稀缺性,包含算力、電力、冷卻、記憶體頻寬和推理預算,這些都是真實且具約束力的限制條件。

文章最後探討了當前企業在AI使用上的實際狀況與未來的發展趨勢。文章指出,企業端最先暴露的問題並非AI乏人問津,而是其使用過於隨意。有案例顯示,某企業客戶單月在Claude上花費高達5億美元,僅因未對員工使用量設定上限。在一些公司內部,將AI使用量作為考核指標,甚至導致員工為了提升績效而讓AI執行低價值任務,產生了「Tokenmaxxing」現象。例如,亞馬遜(Amazon)曾設立內部排行榜,導致員工為刷榜而讓AI執行無意義任務,推高了營運成本。這些案例促使企業開始區分「有效Token」與「無效Token」,並積極尋求控制Token預算的方法,例如Cloudflare推出的AI Gateway。此外,此篇文章也提及定價模式的變化,如GitHub Copilot從按請求收費轉為按Token用量計費,預計將大幅增加部分用戶的費用。這意味著過去被固定訂閱或補貼隱藏的成本,正逐漸浮上企業財務的檯面。對於AI基礎設施的投資邏輯,市場呈現多空分歧。多頭認為,代理式AI將推動Token消耗量大幅增長,短期亂象不會改變長期趨勢。然而,空頭則擔憂,目前產業鏈的繁榮是以犧牲上游消耗為代價,一旦企業面臨真實的按量計費,支撐GPU採購和模型訓練的資本流動可能面臨逆轉。文章總結,儘管這場爭論沒有定論,但Token支出的邊際變化,透過GPU算力、DRAM記憶體及資料中心需求的傳導鏈條,將直接影響輝達、儲存晶片廠商及雲端服務供應商的資本支出預期,因此投資人仍需密切關注。

閱讀完整文章:https://www.moomoo.com/hant/news/post/71364434/wall-street-debates-tokenomics-is-the-ai-bill-spiraling-out?level=3&data_ticket=1781580178252543

Related posts