49015 大模型冷思考:企業“可控”價值創造空間還有多少?

2018高清国产一区二区三区-国产黄色视频免费在线观看-欧美激情欧美精品一区二区-免费国产一级片内射老妇

服務熱線:400-858-9000 咨詢/投訴熱線:
國內專業的一站式創業服務平臺
大模型冷思考:企業“可控”價值創造空間還有多少?
智能相對論 ·

葉遠風

2023/11/03
可以說,大模型給了這個時代全新的增量價值方向,只有幫助企業實現對“可控”價值創造的把握,才能讓企業在這個全新方向更有著力點。
本文來自于微信公眾號“智能相對論”(ID:aixdlun),作者:葉遠風,投融界經授權發布。

毫無疑問,大(da)模(mo)型熱潮(chao)正一浪高過一浪。

在發展進程上,從最(zui)開(kai)始的技(ji)術比拼到現在已開(kai)始全面強調商業(ye)價值變現,百度、科(ke)大訊(xun)飛等廠商都喊出類(lei)似“不能落地的大模型沒有(you)意義”等口號。

在模(mo)(mo)(mo)型(xing)類(lei)型(xing)上,除了(le)百度文心大(da)模(mo)(mo)(mo)型(xing)、訊飛星(xing)火認知大(da)模(mo)(mo)(mo)型(xing)、阿里通義千(qian)問大(da)模(mo)(mo)(mo)型(xing)等通用大(da)模(mo)(mo)(mo)型(xing),醫藥研(yan)發、金融等垂直(zhi)大(da)模(mo)(mo)(mo)型(xing)正積(ji)極涌(yong)現。幾個月(yue)前,新(xin)華三集團在業(ye)內首提“私域(yu)(yu)大(da)模(mo)(mo)(mo)型(xing)”概念,并發布(bu)融合(he)了(le)行業(ye)屬(shu)性(xing)及(ji)地域(yu)(yu)屬(shu)性(xing)的私域(yu)(yu)大(da)模(mo)(mo)(mo)型(xing)——“百業(ye)靈犀”LinSeer,為行業(ye)增(zeng)添了(le)企業(ye)落地大(da)模(mo)(mo)(mo)型(xing)的創(chuang)新(xin)類(lei)型(xing)。

而在(zai)更直接的(de)數字上(shang),截(jie)止到2023年(nian)10月初(chu),國內僅公開的(de)大模型(xing)數量已(yi)達238個(ge),百模大戰(zhan)正(zheng)在(zai)升級千模大戰(zhan)。

……接(jie)近(jin)一年的熱(re)潮后大模型(xing)沒有冷卻(que)的跡象,行業(ye)普遍的共識形(xing)成,這不是(shi)風口,而是(shi)技術革(ge)命。

然(ran)而,歷史一(yi)次次證明,賽道越是熱鬧(nao),參賽者越需要(yao)冷靜的(de)思考。

種(zhong)種(zhong)跡象顯示(shi),雖然看起來百花(hua)齊(qi)放,但事實上AI三大要(yao)素(su)(su)(算力、數(shu)據、算法),以及大模(mo)型(xing)發展的(de)行業(ye)(ye)規則中(zhong),當下以及未來很多因(yin)素(su)(su)已經(jing)既定(ding),一(yi)頭熱扎進去的(de)企業(ye)(ye)們,更應該尋找的(de)是那些不由既成(cheng)的(de)客觀因(yin)素(su)(su)所限(xian)制、能夠進行自我價(jia)值發揮的(de)地方,才能盡(jin)可能獲得相對(dui)競爭優勢。

01

算力“積木化”,

可控價值創造集中到“調度”環節

算力常(chang)(chang)常(chang)(chang)被視為大模型發(fa)展的(de)瓶頸問題,但是,如果從是否“可控”的(de)視角(jiao)看(kan),在(zai)業務層面企(qi)業能自己做(zuo)出決定從而影響算力獲取的(de)地方,其(qi)實越來越少(shao)。

IT時(shi)代(dai)(dai)Windows+Intel構建(jian)起(qi)WinTel體,演變為(wei)移動互聯(lian)網時(shi)代(dai)(dai)安卓(zhuo)+ARM(以高通為(wei)代(dai)(dai)表(biao)),到了(le)大模型時(shi)代(dai)(dai),又(you)進一步演化為(wei)AI大模型+GPU——在當前,Nvidia已(yi)經(jing)成為(wei)大模型趨(qu)同的算力來源。

2021的Ampere(對應A100等(deng))、2022年的Hopper(對應H100等(deng))、2023的Ada架(jia)(jia)構……性(xing)價比高不高,要看Nvidia架(jia)(jia)構發展有(you)多快(kuai)。

算力不再是瓶頸(jing),或者說,其“總(zong)體基(ji)本面”的提升并沒有什么操作(zuo)空間——要多(duo)少(shao)(shao)算力就(jiu)需要多(duo)少(shao)(shao)資(zi)本投入(ru),反過來(lai)有多(duo)少(shao)(shao)資(zi)本投入(ru)基(ji)本也(ye)能買來(lai)多(duo)少(shao)(shao)算力。

當算(suan)力(li)“口子”被外部(bu)技(ji)術(shu)、內部(bu)預算(suan)等限定,通過調度提升既有(you)資源利用效率,就成為企(qi)業“可控”的價值創造過程。特別是私域大(da)(da)模(mo)型,對于企(qi)業來(lai)說,AI大(da)(da)模(mo)型的大(da)(da)小需要平衡算(suan)力(li)和能耗的開支(zhi),應選(xuan)擇適(shi)合行業特點(dian)和業務特點(dian)的大(da)(da)模(mo)型進行私域部(bu)署。

此時,如何榨取硬件資(zi)源提(ti)供(gong)的每一滴能力,加速模(mo)型的訓練速度成為首要考慮的問題,而這方面(mian)術業有(you)專(zhuan)攻,往往依賴基(ji)礎(chu)設(she)施服務(wu)廠商——針對算(suan)力等底層基(ji)礎(chu)設(she)施提(ti)供(gong)支撐(cheng)成為考驗各個(ge)服務(wu)廠商最基(ji)本的能力,其中尤以算(suan)力調度能力是(shi)其重點。

算(suan)(suan)力(li)調度(du)(du)往(wang)往(wang)需要多維能(neng)力(li)協同,所(suo)以(yi),作(zuo)為業內首倡私域大(da)模型(xing)的(de)(de)(de)新(xin)華三給出了自己的(de)(de)(de)回答:依(yi)托通過傲飛(fei)算(suan)(suan)力(li)平(ping)(ping)臺實現算(suan)(suan)力(li)調度(du)(du)的(de)(de)(de)“最(zui)優解(jie)”,讓算(suan)(suan)力(li)可以(yi)最(zui)大(da)化的(de)(de)(de)按需調度(du)(du)。另一方(fang)面以(yi)綠洲(zhou)平(ping)(ping)臺實現大(da)模型(xing)所(suo)需的(de)(de)(de)數(shu)據支撐,同時在分布式訓練等需求下以(yi)智(zhi)能(neng)無損網絡(luo)支持AI集群(qun)訓練,配備高(gao)性能(neng)存儲帶來更(geng)好的(de)(de)(de)底層(ceng)存儲支撐,甚(shen)至(zhi)還(huan)建設有液冷(leng)數(shu)據中心(xin)來維持算(suan)(suan)力(li)輸出的(de)(de)(de)穩定性,以(yi)此構(gou)成一套完整的(de)(de)(de)智(zhi)算(suan)(suan)解(jie)決方(fang)案(an)。

而新華三算力(li)(li)調(diao)度的(de)“主(zhu)腦”傲(ao)飛(fei)算力(li)(li)平臺則具備異構計算資(zi)源統一管理、多元算力(li)(li)資(zi)源智(zhi)(zhi)(zhi)能調(diao)度的(de)能力(li)(li),提供包(bao)含智(zhi)(zhi)(zhi)能標注、智(zhi)(zhi)(zhi)能訓練、智(zhi)(zhi)(zhi)能調(diao)優、智(zhi)(zhi)(zhi)能部署、智(zhi)(zhi)(zhi)能推理的(de)全(quan)流(liu)程算力(li)(li)智(zhi)(zhi)(zhi)能調(diao)度能力(li)(li)。

按官(guan)方數據,該平臺能(neng)夠將算(suan)力(li)利用率提高至(zhi)70%以上(shang)。同時(shi),還支持8000節點的(de)算(suan)力(li)調度(du),并發訓練時(shi)間縮短至(zhi)50%,且斷(duan)點自動接續無感知訓練更穩定,在既有GPU資源(yuan)下能(neng)全(quan)方面(mian)提升大模型(xing)訓練性能(neng)。

說白了(le),就是通過(guo)一(yi)系列(lie)算(suan)力流程(cheng)環節(jie)的銜接優化(尤(you)其(qi)是面對并(bing)行計算(suan)與(yu)分布式計算(suan)需(xu)求(qiu)),在充分保障訓(xun)練與(yu)應用需(xu)求(qiu)的同時(shi)降低GPU的空閑時(shi)間(jian),讓巨大成本獲取來(lai)的算(suan)力資源(yuan)工作盡可能飽和。

總體而言(yan),這一整套(tao)高(gao)性能算(suan)力(li)集群及調度讓客戶能夠(gou)實(shi)現算(suan)力(li)、存力(li)、運力(li)協同感知,實(shi)現算(suan)力(li)資源充分供給、靈(ling)活部署、異構算(suan)力(li)最優調度——雖然有多少算(suan)力(li)資源很難(nan)控制,但(dan)用好這些資源企(qi)業卻能夠(gou)做到完(wan)全可控。

當(dang)然,除了提升算力利(li)用效率,行業中一些做法還(huan)在試(shi)圖通過其他(ta)方式直接降(jiang)低模型(xing)訓練(lian)對(dui)GPU資源的要求,例如數(shu)據存(cun)儲(chu)層面進行算子優(you)化等,未來或也存(cun)在較大的價值(zhi)開發空間。

02

數據“斷面化”,以數據質量建設

帶來“護城河”成為企業的必然選擇

目前,企業能夠獲得的數(shu)據量(liang)來源主要包括公開的數(shu)據集與(yu)自身(shen)沉(chen)淀(dian)。

在當下(xia)時間(jian)斷面,這兩(liang)種都只能被動等待(dai)或由時間(jian)積累,數據“量”其實很難有(you)突破,優勢(shi)有(you)就是有(you),沒有(you)就是沒有(you),并不可(ke)控。

當(dang)然(ran),也有(you)一些企業試圖主(zhu)動(dong)出擊,例如國外公司(si)Inflection AI以大規模提問的方式來主(zhu)動(dong)提升(sheng)數據沉淀速度,但這(zhe)顯然(ran)這(zhe)并不會是主(zhu)流(liu)。

“量”上(shang)不可控(kong),則(ze)可控(kong)的價(jia)值創造空間必須更聚焦于(yu)“質(zhi)”上(shang)。

中信(xin)智(zhi)庫《人工智(zhi)能十(shi)大發展趨(qu)勢(shi)》認(ren)為,“未來(lai)一個模型的(de)好壞,80%由數(shu)據質量決(jue)定。”

從長遠(yuan)視角看,大(da)模(mo)型(xing)的競爭并不(bu)是要(yao)比(bi)(bi)誰跑得更快,而是比(bi)(bi)誰走得更遠(yuan),這就需要(yao)大(da)模(mo)型(xing)真實的應用效(xiao)果,也就需要(yao)通過(guo)各種方式提升數據質量,來鍛造大(da)模(mo)型(xing)發展(zhan)的“內功”。

在(zai)數(shu)據(ju)的(de)(de)(de)計劃、獲取、存儲(chu)、共享、維護、應用等環節,都需要針對(dui)性的(de)(de)(de)數(shu)據(ju)管理、治(zhi)理,最終提升(sheng)數(shu)據(ju)質量。這是(shi)一個系統(tong)性工程,也(ye)為(wei)市面上的(de)(de)(de)基礎設施(shi)服務(wu)商們帶來了(le)機(ji)會。

例(li)如(ru)新華三的綠洲平(ping)(ping)臺就以場景需求為導向,打(da)造(zao)了(le)一個圍繞數據(ju)采集、存儲、管理和應(ying)用的全(quan)棧(zhan)數據(ju)平(ping)(ping)臺。

通過(guo)內置(zhi)AI算法,綠洲平臺大(da)大(da)提升了數(shu)據(ju)標(biao)記能力(li),讓數(shu)據(ju)治理、數(shu)據(ju)開發等(deng)過(guo)去很繁雜(za)的流程工作(zuo)變得(de)極(ji)為(wei)(wei)簡單,而(er)知(zhi)識圖譜構(gou)建能力(li)則(ze)幫(bang)助(zhu)數(shu)據(ju)躍升為(wei)(wei)知(zhi)識,從而(er)能夠(gou)更好地(di)被業務場景所使用。

事實上,數(shu)(shu)據(ju)深加工(gong)帶來(lai)高(gao)質量數(shu)(shu)據(ju)訓(xun)練(lian)(lian)一(yi)直是前沿大(da)模型(xing)的(de)核心競爭(zheng)力(li)所在,OpenAI一(yi)貫(guan)公開其(qi)訓(xun)練(lian)(lian)過程及(ji)算(suan)法(fa),但對數(shu)(shu)據(ju)如何處理(li)緘口(kou)不言。

回(hui)過頭來看,數據(ju)(ju)(ju)的(de)(de)“要素(su)(su)化”與“資產化”正在讓百行百業(ye)再次(ci)審視數據(ju)(ju)(ju)的(de)(de)價(jia)值(zhi)(zhi),在數據(ju)(ju)(ju)越來越作為(wei)一種新型生產力要素(su)(su)的(de)(de)時代,大(da)模型的(de)(de)本質可以視作一種挖掘(jue)數據(ju)(ju)(ju)要素(su)(su)價(jia)值(zhi)(zhi)的(de)(de)工具(ju),而工具(ju)不(bu)決定價(jia)值(zhi)(zhi),只決定效(xiao)率(lv)。

大模型終將走入底層成為(wei)一(yi)種(zhong)普遍(bian)的(de)(de)后端能力,技(ji)術本身越(yue)來(lai)越(yue)無(wu)法(fa)成為(wei)護城(cheng)河,而數據則代表了(le)企業在前端與客戶/用戶的(de)(de)連接程度,數據要素的(de)(de)價值釋(shi)放將成為(wei)企業真正的(de)(de)“護城(cheng)河”。

所有的(de)數(shu)據(ju)類平臺提升數(shu)據(ju)質量的(de)過(guo)程,就是在幫助企(qi)業進一步挖(wa)掘(jue)數(shu)據(ju)要素價(jia)值、沉淀數(shu)據(ju)資產,真正打造企(qi)業的(de)“護城河”。

03

算法“收斂化”,

殊途同歸下企業需聚焦訓練效率提升

算(suan)法(fa)是大模型(xing)的能力核心,但(dan)長期來看(kan),算(suan)法(fa)能力卻終將“收斂”。

目(mu)前的大模(mo)型(xing)算(suan)法基(ji)本(ben)上都基(ji)于(yu)Transformer架(jia)構,該架(jia)構解決了過去RNN架(jia)構難以并(bing)行(xing)化等(deng)核心缺陷(xian),是(shi)基(ji)因“優勝劣(lie)汰”的結果,BERT、GPT、T5、GLM等(deng)都其“衍生品”。

所以,算法(fa)生來都幾乎有著相同的“基因”。

而在開發(fa)框架層面,伴隨著開源生態(tai)建設,國外的(de)TensorFlow、Pytorch,國內的(de)MindSpore等幾個主流框架逐步成為共同的(de)選擇。

這(zhe)意味著(zhu),算法的(de)后天的(de)“成長環境”也逐步趨同(tong)。

先天(tian)(tian)+后天(tian)(tian),算法創新當下看起來百花齊放,但在未來其價值創新的空間將(jiang)逐步收(shou)窄,企業能夠通過努(nu)力獲得的相對優勢將(jiang)越來越少。

甚至(zhi),在Llama 2掀起的開源(yuan)浪潮(chao)下,算(suan)法創新的價值被進一步壓縮(suo)。

因此(ci),從長(chang)期來看,企業最“可(ke)控”的價值創造將(jiang)側重到(dao)訓練效率而非(fei)算(suan)法創新(xin)上——同(tong)樣的能(neng)力與潛力,PK更快速地訓練迭代(dai)。

很(hen)多廠商(shang)提供的(de)開發工具鏈(lian)都在(zai)直(zhi)接(jie)推進訓練效率,而一些原本旨在(zai)提供算(suan)力服務的(de)平臺也(ye)實現了等價的(de)功能。

例如,傲飛算力(li)平臺支(zhi)持斷點自動(dong)接續無(wu)感知訓練,其原(yuan)本目的在于降低參數迭代期間的GPU資(zi)源等待、提升資(zi)源利用效(xiao)率,但(dan)客觀上也直(zhi)接帶來訓練效(xiao)率的提升,讓算法加速迭代,先把潛力(li)跑出(chu)來。

畢竟,加(jia)速算(suan)法訓練(lian),就是(shi)在提升算(suan)力資源利用效率。

04

行業規則“沉淀化”:

長期主義仍需回歸到正確的價值觀

大模型熱潮中(zhong),人人都(dou)會不自覺追求(qiu)技術與商業(ye)價(jia)值“上限”,但大模型“下限”問(wen)題也日益突出(chu),例如數據隱私、數據安全、知識產權、技術濫用等。

從企(qi)業的視角(jiao)看,行業規則建立迫在(zai)眉睫(jie),但其形(xing)成過(guo)程同樣(yang)存在(zai)著不由企(qi)業決定的“客觀因素”。

關于行(xing)業發展的一些法(fa)律(lv)法(fa)規,監管(guan)部門在逐步沉淀(dian),例如國家(jia)網信辦聯合(he)多部門公布的《生成式人工智能服(fu)務管(guan)理(li)暫行(xing)辦法(fa)》,企業要做的是(shi)等(deng)待并盡(jin)力(li)配(pei)合(he)與落實。

關于行業(ye)統(tong)一(yi)共識,也需要一(yi)個個沉(chen)淀(dian),例如,目(mu)前已經有從業(ye)者(zhe)提議行業(ye)協作(zuo)開發統(tong)一(yi)、可信的(de)框架,在隱私(si)保護(hu)、模型效用(yong)和訓(xun)練(lian)效率之間取得平衡,企業(ye)要做(zuo)的(de)是積(ji)極(ji)響應、積(ji)極(ji)參與。

但在一些規則(ze)上,企業能(neng)夠(gou)、也必(bi)須充分發揮“可(ke)控”的(de)價值創造能(neng)力(li)。

例如(ru),大模型數(shu)據安全“容(rong)錯率低”,企(qi)業必須加大投入。

很多基(ji)礎設施廠(chang)商都提供(gong)了相(xiang)關(guan)的服(fu)務(wu),例(li)如新(xin)華三的私域大模型百業靈犀以內置安全限制(zhi)提示詞和出(chu)入(ru)內容(rong)過濾攔截(jie)對所有場(chang)景(jing)下大模型生成(cheng)內容(rong)進(jin)行安全性限制(zhi),針對所有出(chu)入(ru)流量(liang)和內容(rong)進(jin)行安全審計和敏感信息攔截(jie)。

當然,最直(zhi)觀反應大(da)模型倫理、體現“下限”的(de)是場景應用的(de)選(xuan)擇問(wen)題。

科研、制造、醫藥(yao)、法律……大模型已(yi)經走向(xiang)諸多能帶來社會(hui)正向(xiang)價(jia)值的(de)場(chang)景。但是,諸如(ru)偽造視頻進行詐騙(pian)等“場(chang)景應用”也已(yi)經出(chu)現,基于強力(li)的(de)大模型技術(shu)有著(zhu)更強的(de)欺(qi)騙(pian)性。

技(ji)術是(shi)刀,大模(mo)型是(shi)一把更鋒利的(de)刀,它的(de)作用(yong)(yong)和價值由(you)使用(yong)(yong)的(de)人決定。

說到底,企(qi)業需(xu)要構(gou)建正(zheng)確的(de)價值觀(guan),將大模(mo)(mo)型能(neng)力導(dao)向數字經濟的(de)正(zheng)向價值上,才能(neng)守(shou)住“下(xia)限”、實現大模(mo)(mo)型的(de)長期健康發展。

05

結語

大(da)模型賽道上,企(qi)業必(bi)須在“可(ke)控”的價值創造(zao)空間上發力,才能不斷在各個維度獲得(de)更多(duo)相(xiang)對(dui)競爭優勢與發展可(ke)能性。

企業(ye)也必須以此為標準選擇基礎(chu)設(she)施(shi)服務、大(da)模型服務的(de)廠(chang)(chang)商,尤其(qi)是在(zai)多個維度都(dou)能滿足(zu)需(xu)要(yao)的(de)廠(chang)(chang)商。

可以說,大模型給了這個時代(dai)全新的(de)增量價(jia)值方(fang)向(xiang),只有(you)幫助企業(ye)實現對(dui)“可控”價(jia)值創造的(de)把握,才(cai)能(neng)讓企業(ye)在(zai)這個全新方(fang)向(xiang)更有(you)著(zhu)力(li)點。

人工智能 大模型
評論
還可輸入300個字
專欄介紹
智能相對論
111篇文章
深挖人工智能這口井,評出咸淡,講出黑白,道出深淺。
+關注
400-858-9000
免費服務熱線
郵箱
09:00--20:00
服務時間
投訴電話
投融界App下載
官方微信公眾號
官方微信小程序
Copyright ? 2024 浙江投融界科技有限公司(xxccv.cn) 版權所有 | ICP經營許可證:浙B2-20190547 | | 浙公網安備330號
地址:浙江省杭州市西湖區留下街道西溪路740號7號樓301室
浙江投融界科技有限公司xxccv.cn版權所有 | 用戶協議 | 隱私條款 | 用戶權限
應用版本:V2.7.8 | 更新日期:2022-01-21
 
在線客服
微信(xin)訂(ding)閱