50607 大模型“免費”送,廠商們圖什么?

2018高清国产一区二区三区-国产黄色视频免费在线观看-欧美激情欧美精品一区二区-免费国产一级片内射老妇

服務熱線:400-858-9000 咨詢/投訴熱線:
國內專業的一站式創業服務平臺
大模型“免費”送,廠商們圖什么?
壹度Pro ·

辰樹

06/05
參照云計算價格戰的經驗,此番大模型價格戰或許可以吸引更多下游企業認真審視大模型,有望基于相關技術探索出更多良性的商業模式。
本文來自于微信公眾號“壹度Pro”(ID:yiducaijing2021),作者:辰樹,投融界經授權發布。

2024年618,傳統電商(shang)行業(ye)不再喧囂(xiao),但大(da)模型市場卻開啟了慘(can)烈的“價格戰”,甚至(zhi)部分企業(ye)直接免(mian)費送大(da)模型服務。

5月15日,字節(jie)跳動宣布(bu),豆包主力模型企業市(shi)場定價為0.0008元(yuan)/千Tokens,0.8厘可處理(li)1500多(duo)個漢字,比行(xing)業便宜99.3%。

一周后,阿里(li)云(yun)也對外宣布(bu),通義千問GPT-4級主力模型Qwen-Long的API輸入價格降至0.0005元/千Tokens,直降97%。

阿里云卷入“價格戰”后(hou),百度(du)(du)、騰訊云、科大(da)訊飛等企業(ye)也接(jie)連宣(xuan)布(bu)自家的大(da)模型降價。其中(zhong)百度(du)(du)甚(shen)至宣(xuan)布(bu),兩(liang)款基礎(chu)模型可免費調用。

不(bu)可否認的(de)是(shi),隨著技術(shu)逐漸成熟,大(da)模型(xing)的(de)成本正不(bu)斷下(xia)探。為了盡(jin)快俘獲更多企(qi)業(ye)客戶(hu),拓寬市場(chang)影(ying)響(xiang)力,上(shang)游算力提(ti)供商確實(shi)需要盡(jin)力降價。

然(ran)而需要注(zhu)意的(de)是,盡(jin)管大(da)模(mo)型成本正(zheng)逐步下(xia)探(tan),但目(mu)前大(da)部分企(qi)(qi)業(ye)的(de)大(da)模(mo)型業(ye)務依然(ran)面臨算(suan)力(li)、人力(li)成本高企(qi)(qi)的(de)挑戰(zhan),沒能盈利。在此背景(jing)下(xia),上游(you)算(suan)力(li)提(ti)供商(shang)不斷降價,甚至(zhi)免費(fei)送大(da)模(mo)型,顯(xian)得十分反(fan)常(chang)。

這種非理性的價(jia)格戰,其實(shi)凸(tu)顯出(chu)了上游企(qi)業亟待(dai)通過(guo)讓利,打(da)通大模(mo)型商業閉(bi)環的內在焦慮。

01

價格戰背后,大模型商業困局難解

2023年以(yi)來,隨著ChatGPT爆火,諸多科技公司都看到(dao)了AI大模(mo)型蘊含著巨大的(de)商業(ye)價值,因而加碼相關業(ye)務。2024年3月,國家數(shu)據局局長(chang)劉烈宏(hong)透露,中國10億參數(shu)規(gui)模(mo)以(yi)上大模(mo)型數(shu)量(liang)已超(chao)100個。

大模型“免費”送,廠商們圖什么?

然而隨著越來(lai)越多企業(ye)入局相(xiang)關產業(ye),大模型(xing)商業(ye)模式不健全(quan),成本高、落地難、下游企業(ye)持觀(guan)望態度等問題愈發凸顯。

由于(yu)需(xu)要采購高性能計算機,并(bing)且需(xu)要進行模型(xing)訓練,大模型(xing)的(de)(de)成本(ben)異(yi)常高昂。以OpenAI為例,其訓練GPT-4的(de)(de)FLOPS約(yue)為2.15e25,一次訓練成本(ben)為6300萬美元。The Information報(bao)道,2022年,OpenAI虧損(sun)約(yue)為5.4億美元左右,約(yue)擴大一倍。

目前,大(da)部分(fen)企(qi)業(ye)(ye)都意識(shi)到了大(da)模(mo)(mo)型(xing)的參數越(yue)多,商(shang)業(ye)(ye)想象力越(yue)大(da),因而持續(xu)加碼(ma)模(mo)(mo)型(xing)訓練。不過問(wen)題也隨(sui)之而來,那(nei)就(jiu)是(shi)大(da)模(mo)(mo)型(xing)僅僅問(wen)世兩年時間(jian),下游創(chuang)收手段十分(fen)有限。

整體而言(yan),大模型(xing)有兩種創收模式,一是直接向用(yong)戶收取訂閱費,二是向開(kai)發者(zhe)收取API調用(yong)費。比(bi)如,2023年初,OpenAI推出了會員訂閱服務ChatGPT Plus,費用(yong)為20美元/月,可使用(yong)基于(yu)GPT-4的模型(xing),并(bing)且提供更快的響應時間、優先訪問(wen)等(deng)權限。

不過,據Reddot聯合創始人Pierre Herubel測算,即(ji)使以(yi)每月擁有100萬訂戶估計,ChatGPT Plus每年或只能為OpenAI帶來2.4億美元左右收入,很難幫助公司扭(niu)虧為盈。

因此(ci),目前以(yi)OpenAI為代表企業(ye)(ye)的(de)發力(li)(li)重點,是向企業(ye)(ye)收取(qu)API調用(yong)費。參照(zhao)云計算的(de)經驗,外部的(de)企業(ye)(ye)從(cong)零開(kai)始訓練大(da)語(yu)言模型非常(chang)困難(nan),傾向于采購成熟(shu)的(de)AI大(da)模型技(ji)術(shu),一旦這些企業(ye)(ye)探索出具備想象力(li)(li)的(de)商業(ye)(ye)模式,即可反哺上游算力(li)(li)提(ti)供(gong)商,進(jin)而實現多方共贏。

對此(ci),2023年11月(yue),百度創始(shi)人(ren)兼CEO李彥宏(hong)曾表示,不斷地(di)重復(fu)開發基礎大(da)模型是(shi)對社(she)會(hui)資源的極(ji)大(da)浪費,“AI原生(sheng)時(shi)代(dai),我們需(xu)要100萬量級的AI原生(sheng)應用,但(dan)是(shi)不需(xu)要100個大(da)模型。”

02

算力提供商作出表率,但B端企業仍持觀望態度

由(you)于大(da)部(bu)分(fen)大(da)模型算力提供(gong)商(shang)都是平臺(tai)型企(qi)業(ye)(ye)(ye),推(tui)出大(da)模型技術后(hou),這些企(qi)業(ye)(ye)(ye)紛紛在內部(bu)試水相關技術的商(shang)業(ye)(ye)(ye)化(hua),以圖給(gei)下游客戶(hu)做出商(shang)業(ye)(ye)(ye)化(hua)表率。

比如,2023年(nian)阿(a)里云峰會(hui)上(shang),時(shi)任阿(a)里巴(ba)(ba)巴(ba)(ba)集(ji)團董事會(hui)主席兼CEO、阿(a)里云智能集(ji)團CEO張勇表示:“阿(a)里巴(ba)(ba)巴(ba)(ba)所有產品未來將(jiang)接入‘通義千問(wen)’大模型,進行全(quan)面改造。”

以釘(ding)釘(ding)為例,接入(ru)大模(mo)型(xing)后(hou),其支持AI生(sheng)成推廣(guang)文案、繪圖方(fang)式創建應用(yong)、視頻會議中生(sheng)成摘要等功能。釘(ding)釘(ding)總(zong)裁葉軍(jun)認為,大模(mo)型(xing)將會讓釘(ding)釘(ding)的收入(ru)增長百分之幾十(shi)。

無(wu)獨有偶,過去一段時間,騰(teng)訊(xun)也積極探索AI技術的商(shang)業(ye)化(hua)應(ying)用。2023年(nian)財報中,騰(teng)訊(xun)對(dui)外表示(shi):“廣告AI模型的改進顯著(zhu)提升了精準(zhun)投放的效果…… 這(zhe)些發展帶(dai)動了高質(zhi)量的收入來源,推動毛利增長(chang) 23%。”

自有業(ye)務挖(wa)掘出AI的商業(ye)價值后,上游算(suan)力(li)提供商正致力(li)于(yu)針對垂直行(xing)業(ye)的細分需求,提供定制大模型能力(li)。

比(bi)如,2023年(nian)6月,騰(teng)訊(xun)云(yun)宣布(bu)開啟“騰(teng)訊(xun)云(yun)行業大(da)模型生態(tai)計(ji)劃”,致力于推進大(da)模型在產業領域的創新和(he)落地(di)。據悉,騰(teng)訊(xun)云(yun)已為(wei)傳媒(mei)、文旅、政務等(deng)10余個行業提(ti)供了超50個大(da)模型行業解決方案。

然而需要(yao)注(zhu)意的是,平臺型企業大多(duo)擁有自研(yan)大模型技術,無論是試錯還(huan)是使用成本都更(geng)低(di),往往只會對外宣傳商業路徑清晰的大模型落地案例。

反觀外部(bu)的(de)企(qi)(qi)業(ye)需要采購上游的(de)大模型技(ji)術,探(tan)索成本相(xiang)對更高,并(bing)且商業(ye)模式不清晰(xi),很難擁有足夠(gou)的(de)積極(ji)性。見實團隊(dui)披露的(de)《AI應用需求(qiu)與(yu)付費意愿調研報告》顯(xian)示,46.2%的(de)企(qi)(qi)業(ye)AI預(yu)算在1萬元(yuan)以下(xia),另有22.2%和24%的(de)企(qi)(qi)業(ye)預(yu)算分別為1萬-5萬元(yuan)以及5萬元(yuan)-10萬元(yuan),這些中(zhong)腰部(bu)企(qi)(qi)業(ye)沒有足夠(gou)的(de)預(yu)算探(tan)索AI。

此前,大部分主力模型產品的API輸入(ru)價(jia)格不(bu)菲(fei),比如,Qwen-Long為(wei)0.02元/千tokens,1萬元只可以購買(mai)5億個(ge)(ge)tokens。如果一個(ge)(ge)產品有(you)500萬月(yue)活,1萬元的預(yu)算(suan),一個(ge)(ge)月(yue)平均只能供每個(ge)(ge)用戶使用100個(ge)(ge)tokens,顯然(ran)不(bu)夠。

03

成本雖屢屢下探,但算力提供商已急不可耐

顯而(er)易見,當下限(xian)(xian)制大(da)模(mo)型(xing)B端商業化落(luo)地(di)的(de)(de)主(zhu)要障(zhang)礙(ai),就是(shi)API成(cheng)本(ben)過(guo)高,限(xian)(xian)制了B端企業探索相應的(de)(de)商業閉(bi)環。因(yin)此,目前算力提供商的(de)(de)發力方向,就是(shi)致力于通過(guo)技術手(shou)段,壓低大(da)模(mo)型(xing)的(de)(de)成(cheng)本(ben),降低B端企業的(de)(de)使(shi)用成(cheng)本(ben)。

開(kai)頭提到,字節(jie)跳動旗下豆包(bao)主(zhu)力模型企業市場定價(jia)為0.0008元/千Tokens,比行(xing)業便(bian)宜99.3%。對此,火(huo)山(shan)引(yin)擎(qing)總(zong)裁譚(tan)待表(biao)示:“豆包(bao)模型的超低(di)定價(jia),來(lai)源于我(wo)們有信心用(yong)技術手段優化成(cheng)本,而(er)不是補(bu)貼或是打價(jia)格戰爭奪市場份額(e)。”

無獨有(you)偶,2024年5月6日,深度求(qiu)索開源了第二代MoE模(mo)型DeepSeek-V2,性(xing)能更(geng)強,訓(xun)練成(cheng)本更(geng)低。據悉(xi),DeepSeek可節省42.5%訓(xun)練成(cheng)本,減少93.3%的KV緩存(cun),最大吞吐量提高(gao)5.76倍。整體而言,DeepSeek-V2消耗的顯(xian)存(cun)(KV Cache)只(zhi)有(you)同(tong)級別Dense模(mo)型的1/5-1/100。

不(bu)過,這并(bing)不(bu)意味著當下大模(mo)(mo)型行(xing)業(ye)(ye)的價格戰十分正常。2024年5月,談及(ji)大模(mo)(mo)型的發展趨(qu)勢時,零一萬物CEO李開復接受采訪時表示:“未來(lai)整(zheng)個(ge)行(xing)業(ye)(ye)的推理成本(ben)(ben)每年降低10倍(bei)是可(ke)以期待的,而且這個(ge)趨(qu)勢是必然的。”未來(lai),大模(mo)(mo)型的成本(ben)(ben)將(jiang)呈階梯(ti)狀下探,但目前大模(mo)(mo)型的價格卻(que)斷崖式下探,甚至部分企業(ye)(ye)免費送,降價幅度遠超上游成本(ben)(ben)降幅。

上游算(suan)力提(ti)供商(shang)之所以(yi)如此內卷,很大(da)程(cheng)度上都是(shi)希望俘獲(huo)更多的(de)B端企(qi)(qi)業,一(yi)方面(mian)實現規模(mo)效應,另一(yi)方面(mian),讓(rang)B端企(qi)(qi)業無負(fu)擔地探(tan)索(suo)良性的(de)商(shang)業模(mo)式。對此,譚待表示:“大(da)的(de)使(shi)用量,才能打(da)磨出好模(mo)型,也能大(da)幅降低(di)模(mo)型推理(li)的(de)單位成本……大(da)模(mo)型從以(yi)分(fen)計價到以(yi)厘計價,將助(zhu)力企(qi)(qi)業以(yi)更低(di)成本加速業務創新。”

盡管激烈的價格戰之下,大模型已經進入“免費時代”,但(dan)其實大部分上游算力(li)提供(gong)商為(wei)了后續創收,都留有更為(wei)隱晦的收費手段。

目前,大(da)部分大(da)模(mo)型(xing)僅推理(li)用(yong)的token降(jiang)價(jia),而訓(xun)練和部署成本依然不低(di)。比(bi)如,阿里(li)的qwen-turbo 模(mo)型(xing)百萬個(ge)token推理(li)只要2元(yuan),若是訓(xun)練,就需(xu)要30元(yuan),部署時,每月需(xu)要2萬元(yuan)。

由此來(lai)看,大(da)模(mo)型(xing)進入“免費時(shi)代(dai)”,很大(da)程(cheng)度上(shang)其(qi)實(shi)只是一(yi)個(ge)宣傳(chuan)意義上(shang)的噱頭。如果下(xia)游企業想(xiang)要用上(shang)成(cheng)套大(da)模(mo)型(xing)服務(wu),那么不能不付出(chu)更高(gao)的使用成(cheng)本。

而(er)之所(suo)以上游算力提供商(shang)僅僅降低(di)推理用的(de)token成本,主要是因為通過內部應用,其對于大模型的(de)商(shang)業價值足(zu)夠(gou)自(zi)信,希望降價的(de)噱頭(tou)起到引(yin)流的(de)作用。

參照云計算(suan)價(jia)格(ge)(ge)戰的(de)經驗,此番(fan)大模(mo)型價(jia)格(ge)(ge)戰或許可以(yi)吸引(yin)更(geng)多(duo)下游企業(ye)認真審視大模(mo)型,有望基于相關技術探(tan)索(suo)出更(geng)多(duo)良(liang)性的(de)商業(ye)模(mo)式。

大模型 AI 算力
評論
還可輸入300個字
400-858-9000
免費服務熱線
郵箱
09:00--20:00
服務時間
投訴電話
投融界App下載
官方微信公眾號
官方微信小程序
Copyright ? 2024 浙江投融界科技有限公司(xxccv.cn) 版權所有 | ICP經營許可證:浙B2-20190547 | | 浙公網安備330號
地址:浙江省杭州市西湖區留下街道西溪路740號7號樓301室
浙江投融界科技有限公司xxccv.cn版權所有 | 用戶協議 | 隱私條款 | 用戶權限
應用版本:V2.7.8 | 更新日期:2022-01-21
 
在線客服
微信(xin)訂(ding)閱