大模型“免费”送，厂商们图什么？

大模型“免費”送，廠商們圖什么？

壹度Pro ·

辰樹

06/05

參照云計算價格戰的經驗，此番大模型價格戰或許可以吸引更多下游企業認真審視大模型，有望基于相關技術探索出更多良性的商業模式。

本文來自于微信公眾號“壹度Pro”（ID：yiducaijing2021），作者：辰樹，投融界經授權發布。

2024年618，傳統電商(shang)行業(ye)不再喧囂(xiao)，但大(da)模型市場卻開啟了慘(can)烈的“價格戰”，甚至(zhi)部分企業(ye)直接免(mian)費送大(da)模型服務。

5月15日，字節(jie)跳動宣布(bu)，豆包主力模型企業市(shi)場定價為0.0008元(yuan)/千Tokens，0.8厘可處理(li)1500多(duo)個漢字，比行(xing)業便宜99.3%。

一周后，阿里(li)云(yun)也對外宣布(bu)，通義千問GPT-4級主力模型Qwen-Long的API輸入價格降至0.0005元/千Tokens，直降97%。

阿里云卷入“價格戰”后(hou)，百度(du)(du)、騰訊云、科大(da)訊飛等企業(ye)也接(jie)連宣(xuan)布(bu)自家的大(da)模型降價。其中(zhong)百度(du)(du)甚(shen)至宣(xuan)布(bu)，兩(liang)款基礎(chu)模型可免費調用。

不(bu)可否認的(de)是(shi)，隨著技術(shu)逐漸成熟，大(da)模型(xing)的(de)成本正不(bu)斷下(xia)探。為了盡(jin)快俘獲更多企(qi)業(ye)客戶(hu)，拓寬市場(chang)影(ying)響(xiang)力，上(shang)游算力提(ti)供商確實(shi)需要盡(jin)力降價。

然(ran)而需要注(zhu)意的(de)是，盡(jin)管大(da)模(mo)型成本正(zheng)逐步下(xia)探(tan)，但目(mu)前大(da)部分企(qi)(qi)業(ye)的(de)大(da)模(mo)型業(ye)務依然(ran)面臨算(suan)力(li)、人力(li)成本高企(qi)(qi)的(de)挑戰(zhan)，沒能盈利。在此背景(jing)下(xia)，上游(you)算(suan)力(li)提(ti)供商(shang)不斷降價，甚至(zhi)免費(fei)送大(da)模(mo)型，顯(xian)得十分反(fan)常(chang)。

這種非理性的價(jia)格戰，其實(shi)凸(tu)顯出(chu)了上游企(qi)業亟待(dai)通過(guo)讓利，打(da)通大模(mo)型商業閉(bi)環的內在焦慮。

價格戰背后，大模型商業困局難解

2023年以(yi)來，隨著ChatGPT爆火，諸多科技公司都看到(dao)了AI大模(mo)型蘊含著巨大的(de)商業(ye)價值，因而加碼相關業(ye)務。2024年3月，國家數(shu)據局局長(chang)劉烈宏(hong)透露，中國10億參數(shu)規(gui)模(mo)以(yi)上大模(mo)型數(shu)量(liang)已超(chao)100個。

大模型“免費”送，廠商們圖什么？

然而隨著越來(lai)越多企業(ye)入局相(xiang)關產業(ye)，大模型(xing)商業(ye)模式不健全(quan)，成本高、落地難、下游企業(ye)持觀(guan)望態度等問題愈發凸顯。

由于(yu)需(xu)要采購高性能計算機，并(bing)且需(xu)要進行模型(xing)訓練，大模型(xing)的(de)(de)成本(ben)異(yi)常高昂。以OpenAI為例，其訓練GPT-4的(de)(de)FLOPS約(yue)為2.15e25，一次訓練成本(ben)為6300萬美元。The Information報(bao)道，2022年，OpenAI虧損(sun)約(yue)為5.4億美元左右，約(yue)擴大一倍。

目前，大(da)部分(fen)企(qi)業(ye)(ye)都意識(shi)到了大(da)模(mo)(mo)型(xing)的參數越(yue)多，商(shang)業(ye)(ye)想象力越(yue)大(da)，因而持續(xu)加碼(ma)模(mo)(mo)型(xing)訓練。不過問(wen)題也隨(sui)之而來，那(nei)就(jiu)是(shi)大(da)模(mo)(mo)型(xing)僅僅問(wen)世兩年時間(jian)，下游創(chuang)收手段十分(fen)有限。

整體而言(yan)，大模型(xing)有兩種創收模式，一是直接向用(yong)戶收取訂閱費，二是向開(kai)發者(zhe)收取API調用(yong)費。比(bi)如，2023年初，OpenAI推出了會員訂閱服務ChatGPT Plus，費用(yong)為20美元/月，可使用(yong)基于(yu)GPT-4的模型(xing)，并(bing)且提供更快的響應時間、優先訪問(wen)等(deng)權限。

不過，據Reddot聯合創始人Pierre Herubel測算，即(ji)使以(yi)每月擁有100萬訂戶估計，ChatGPT Plus每年或只能為OpenAI帶來2.4億美元左右收入，很難幫助公司扭(niu)虧為盈。

因此(ci)，目前以(yi)OpenAI為代表企業(ye)(ye)的(de)發力(li)(li)重點，是向企業(ye)(ye)收取(qu)API調用(yong)費。參照(zhao)云計算的(de)經驗，外部的(de)企業(ye)(ye)從(cong)零開(kai)始訓練大(da)語(yu)言模型非常(chang)困難(nan)，傾向于采購成熟(shu)的(de)AI大(da)模型技(ji)術(shu)，一旦這些企業(ye)(ye)探索出具備想象力(li)(li)的(de)商業(ye)(ye)模式，即可反哺上游算力(li)(li)提(ti)供(gong)商，進(jin)而實現多方共贏。

對此(ci)，2023年11月(yue)，百度創始(shi)人(ren)兼CEO李彥宏(hong)曾表示，不斷地(di)重復(fu)開發基礎大(da)模型是(shi)對社(she)會(hui)資源的極(ji)大(da)浪費，“AI原生(sheng)時(shi)代(dai)，我們需(xu)要100萬量級的AI原生(sheng)應用，但(dan)是(shi)不需(xu)要100個大(da)模型。”

算力提供商作出表率，但B端企業仍持觀望態度

由(you)于大(da)部(bu)分(fen)大(da)模型算力提供(gong)商(shang)都是平臺(tai)型企(qi)業(ye)(ye)(ye)，推(tui)出大(da)模型技術后(hou)，這些企(qi)業(ye)(ye)(ye)紛紛在內部(bu)試水相關技術的商(shang)業(ye)(ye)(ye)化(hua)，以圖給(gei)下游客戶(hu)做出商(shang)業(ye)(ye)(ye)化(hua)表率。

比如，2023年(nian)阿(a)里云峰會(hui)上(shang)，時(shi)任阿(a)里巴(ba)(ba)巴(ba)(ba)集(ji)團董事會(hui)主席兼CEO、阿(a)里云智能集(ji)團CEO張勇表示：“阿(a)里巴(ba)(ba)巴(ba)(ba)所有產品未來將(jiang)接入‘通義千問(wen)’大模型，進行全(quan)面改造。”

以釘(ding)釘(ding)為例，接入(ru)大模(mo)型(xing)后(hou)，其支持AI生(sheng)成推廣(guang)文案、繪圖方(fang)式創建應用(yong)、視頻會議中生(sheng)成摘要等功能。釘(ding)釘(ding)總(zong)裁葉軍(jun)認為，大模(mo)型(xing)將會讓釘(ding)釘(ding)的收入(ru)增長百分之幾十(shi)。

無(wu)獨有偶，過去一段時間，騰(teng)訊(xun)也積極探索AI技術的商(shang)業(ye)化(hua)應(ying)用。2023年(nian)財報中，騰(teng)訊(xun)對(dui)外表示(shi)：“廣告AI模型的改進顯著(zhu)提升了精準(zhun)投放的效果…… 這(zhe)些發展帶(dai)動了高質(zhi)量的收入來源，推動毛利增長(chang) 23%。”

自有業(ye)務挖(wa)掘出AI的商業(ye)價值后，上游算(suan)力(li)提供商正致力(li)于(yu)針對垂直行(xing)業(ye)的細分需求，提供定制大模型能力(li)。

比(bi)如，2023年(nian)6月，騰(teng)訊(xun)云(yun)宣布(bu)開啟“騰(teng)訊(xun)云(yun)行業大(da)模型生態(tai)計(ji)劃”，致力于推進大(da)模型在產業領域的創新和(he)落地(di)。據悉，騰(teng)訊(xun)云(yun)已為(wei)傳媒(mei)、文旅、政務等(deng)10余個行業提(ti)供了超50個大(da)模型行業解決方案。

然而需要(yao)注(zhu)意的是，平臺型企業大多(duo)擁有自研(yan)大模型技術，無論是試錯還(huan)是使用成本都更(geng)低(di)，往往只會對外宣傳商業路徑清晰的大模型落地案例。

反觀外部(bu)的(de)企(qi)(qi)業(ye)需要采購上游的(de)大模型技(ji)術，探(tan)索成本相(xiang)對更高，并(bing)且商業(ye)模式不清晰(xi)，很難擁有足夠(gou)的(de)積極(ji)性。見實團隊(dui)披露的(de)《AI應用需求(qiu)與(yu)付費意愿調研報告》顯(xian)示，46.2%的(de)企(qi)(qi)業(ye)AI預(yu)算在1萬元(yuan)以下(xia)，另有22.2%和24%的(de)企(qi)(qi)業(ye)預(yu)算分別為1萬-5萬元(yuan)以及5萬元(yuan)-10萬元(yuan)，這些中(zhong)腰部(bu)企(qi)(qi)業(ye)沒有足夠(gou)的(de)預(yu)算探(tan)索AI。

此前，大部分主力模型產品的API輸入(ru)價(jia)格不(bu)菲(fei)，比如，Qwen-Long為(wei)0.02元/千tokens，1萬元只可以購買(mai)5億個(ge)(ge)tokens。如果一個(ge)(ge)產品有(you)500萬月(yue)活，1萬元的預(yu)算(suan)，一個(ge)(ge)月(yue)平均只能供每個(ge)(ge)用戶使用100個(ge)(ge)tokens，顯然(ran)不(bu)夠。

成本雖屢屢下探，但算力提供商已急不可耐

顯而(er)易見，當下限(xian)(xian)制大(da)模(mo)型(xing)B端商業化落(luo)地(di)的(de)(de)主(zhu)要障(zhang)礙(ai)，就是(shi)API成(cheng)本(ben)過(guo)高，限(xian)(xian)制了B端企業探索相應的(de)(de)商業閉(bi)環。因(yin)此，目前算力提供商的(de)(de)發力方向，就是(shi)致力于通過(guo)技術手(shou)段，壓低大(da)模(mo)型(xing)的(de)(de)成(cheng)本(ben)，降低B端企業的(de)(de)使(shi)用成(cheng)本(ben)。

開(kai)頭提到，字節(jie)跳動旗下豆包(bao)主(zhu)力模型企業市場定價(jia)為0.0008元/千Tokens，比行(xing)業便(bian)宜99.3%。對此，火(huo)山(shan)引(yin)擎(qing)總(zong)裁譚(tan)待表(biao)示：“豆包(bao)模型的超低(di)定價(jia)，來(lai)源于我(wo)們有信心用(yong)技術手段優化成(cheng)本，而(er)不是補(bu)貼或是打價(jia)格戰爭奪市場份額(e)。”

無獨有(you)偶，2024年5月6日，深度求(qiu)索開源了第二代MoE模(mo)型DeepSeek-V2，性(xing)能更(geng)強，訓(xun)練成(cheng)本更(geng)低。據悉(xi)，DeepSeek可節省42.5%訓(xun)練成(cheng)本，減少93.3%的KV緩存(cun)，最大吞吐量提高(gao)5.76倍。整體而言，DeepSeek-V2消耗的顯(xian)存(cun)（KV Cache）只(zhi)有(you)同(tong)級別Dense模(mo)型的1/5-1/100。

不(bu)過，這并(bing)不(bu)意味著當下大模(mo)(mo)型行(xing)業(ye)(ye)的價格戰十分正常。2024年5月，談及(ji)大模(mo)(mo)型的發展趨(qu)勢時，零一萬物CEO李開復接受采訪時表示：“未來(lai)整(zheng)個(ge)行(xing)業(ye)(ye)的推理成本(ben)(ben)每年降低10倍(bei)是可(ke)以期待的，而且這個(ge)趨(qu)勢是必然的。”未來(lai)，大模(mo)(mo)型的成本(ben)(ben)將(jiang)呈階梯(ti)狀下探，但目前大模(mo)(mo)型的價格卻(que)斷崖式下探，甚至部分企業(ye)(ye)免費送，降價幅度遠超上游成本(ben)(ben)降幅。

上游算(suan)力提(ti)供商(shang)之所以(yi)如此內卷，很大(da)程(cheng)度上都是(shi)希望俘獲(huo)更多的(de)B端企(qi)(qi)業，一(yi)方面(mian)實現規模(mo)效應，另一(yi)方面(mian)，讓(rang)B端企(qi)(qi)業無負(fu)擔地探(tan)索(suo)良性的(de)商(shang)業模(mo)式。對此，譚待表示：“大(da)的(de)使(shi)用量，才能打(da)磨出好模(mo)型，也能大(da)幅降低(di)模(mo)型推理(li)的(de)單位成本……大(da)模(mo)型從以(yi)分(fen)計價到以(yi)厘計價，將助(zhu)力企(qi)(qi)業以(yi)更低(di)成本加速業務創新。”

盡管激烈的價格戰之下，大模型已經進入“免費時代”，但(dan)其實大部分上游算力(li)提供(gong)商為(wei)了后續創收，都留有更為(wei)隱晦的收費手段。

目前，大(da)部分大(da)模(mo)型(xing)僅推理(li)用(yong)的token降(jiang)價(jia)，而訓(xun)練和部署成本依然不低(di)。比(bi)如，阿里(li)的qwen-turbo 模(mo)型(xing)百萬個(ge)token推理(li)只要2元(yuan)，若是訓(xun)練，就需(xu)要30元(yuan)，部署時，每月需(xu)要2萬元(yuan)。

由此來(lai)看，大(da)模(mo)型(xing)進入“免費時(shi)代(dai)”，很大(da)程(cheng)度上(shang)其(qi)實(shi)只是一(yi)個(ge)宣傳(chuan)意義上(shang)的噱頭。如果下(xia)游企業想(xiang)要用上(shang)成(cheng)套大(da)模(mo)型(xing)服務(wu)，那么不能不付出(chu)更高(gao)的使用成(cheng)本。

而(er)之所(suo)以上游算力提供商(shang)僅僅降低(di)推理用的(de)token成本，主要是因為通過內部應用，其對于大模型的(de)商(shang)業價值足(zu)夠(gou)自(zi)信，希望降價的(de)噱頭(tou)起到引(yin)流的(de)作用。

參照云計算(suan)價(jia)格(ge)(ge)戰的(de)經驗，此番(fan)大模(mo)型價(jia)格(ge)(ge)戰或許可以(yi)吸引(yin)更(geng)多(duo)下游企業(ye)認真審視大模(mo)型，有望基于相關技術探(tan)索(suo)出更(geng)多(duo)良(liang)性的(de)商業(ye)模(mo)式。

大模型 AI 算力

評論

還可輸入300個字

發布留言

2018高清国产一区二区三区-国产黄色视频免费在线观看-欧美激情欧美精品一区二区-免费国产一级片内射老妇