大模型冷思考：企业“可控”价值创造空间还有多少？

大模型冷思考：企業“可控”價值創造空間還有多少？

葉遠風

2023/11/03

可以說，大模型給了這個時代全新的增量價值方向，只有幫助企業實現對“可控”價值創造的把握，才能讓企業在這個全新方向更有著力點。

本文來自于微信公眾號“智能相對論”（ID：aixdlun），作者：葉遠風，投融界經授權發布。

毫無疑問，大(da)模(mo)型熱潮(chao)正一浪高過一浪。

在發展進程上，從最(zui)開(kai)始的技(ji)術比拼到現在已開(kai)始全面強調商業(ye)價值變現，百度、科(ke)大訊(xun)飛等廠商都喊出類(lei)似“不能落地的大模型沒有(you)意義”等口號。

在模(mo)(mo)(mo)型(xing)類(lei)型(xing)上，除了(le)百度文心大(da)模(mo)(mo)(mo)型(xing)、訊飛星(xing)火認知大(da)模(mo)(mo)(mo)型(xing)、阿里通義千(qian)問大(da)模(mo)(mo)(mo)型(xing)等通用大(da)模(mo)(mo)(mo)型(xing)，醫藥研(yan)發、金融等垂直(zhi)大(da)模(mo)(mo)(mo)型(xing)正積(ji)極涌(yong)現。幾個月(yue)前，新(xin)華三集團在業(ye)內首提“私域(yu)(yu)大(da)模(mo)(mo)(mo)型(xing)”概念，并發布(bu)融合(he)了(le)行業(ye)屬(shu)性(xing)及(ji)地域(yu)(yu)屬(shu)性(xing)的私域(yu)(yu)大(da)模(mo)(mo)(mo)型(xing)——“百業(ye)靈犀”LinSeer，為行業(ye)增(zeng)添了(le)企業(ye)落地大(da)模(mo)(mo)(mo)型(xing)的創(chuang)新(xin)類(lei)型(xing)。

而在(zai)更直接的(de)數字上(shang)，截(jie)止到2023年(nian)10月初(chu)，國內僅公開的(de)大模型(xing)數量已(yi)達238個(ge)，百模大戰(zhan)正(zheng)在(zai)升級千模大戰(zhan)。

……接(jie)近(jin)一年的熱(re)潮后大模型(xing)沒有冷卻(que)的跡象，行業(ye)普遍的共識形(xing)成，這不是(shi)風口，而是(shi)技術革(ge)命。

然(ran)而，歷史一(yi)次次證明，賽道越是熱鬧(nao)，參賽者越需要(yao)冷靜的(de)思考。

種(zhong)種(zhong)跡象顯示(shi)，雖然看起來百花(hua)齊(qi)放，但事實上AI三大要(yao)素(su)(su)(算力、數(shu)據、算法)，以及大模(mo)型(xing)發展的(de)行業(ye)(ye)規則中(zhong)，當下以及未來很多因(yin)素(su)(su)已經(jing)既定(ding)，一(yi)頭熱扎進去的(de)企業(ye)(ye)們，更應該尋找的(de)是那些不由既成(cheng)的(de)客觀因(yin)素(su)(su)所限(xian)制、能夠進行自我價(jia)值發揮的(de)地方，才能盡(jin)可能獲得相對(dui)競爭優勢。

算力“積木化”，

可控價值創造集中到“調度”環節

算力常(chang)(chang)常(chang)(chang)被視為大模型發(fa)展的(de)瓶頸問題，但是，如果從是否“可控”的(de)視角(jiao)看(kan)，在(zai)業務層面企(qi)業能自己做(zuo)出決定從而影響算力獲取的(de)地方，其(qi)實越來越少(shao)。

IT時(shi)代(dai)(dai)Windows+Intel構建(jian)起(qi)WinTel體，演變為(wei)移動互聯(lian)網時(shi)代(dai)(dai)安卓(zhuo)+ARM(以高通為(wei)代(dai)(dai)表(biao))，到了(le)大模型時(shi)代(dai)(dai)，又(you)進一步演化為(wei)AI大模型+GPU——在當前，Nvidia已(yi)經(jing)成為(wei)大模型趨(qu)同的算力來源。

2021的Ampere(對應A100等(deng))、2022年的Hopper(對應H100等(deng))、2023的Ada架(jia)(jia)構……性(xing)價比高不高，要看Nvidia架(jia)(jia)構發展有(you)多快(kuai)。

算力不再是瓶頸(jing)，或者說，其“總(zong)體基(ji)本面”的提升并沒有什么操作(zuo)空間——要多(duo)少(shao)(shao)算力就(jiu)需要多(duo)少(shao)(shao)資(zi)本投入(ru)，反過來(lai)有多(duo)少(shao)(shao)資(zi)本投入(ru)基(ji)本也(ye)能買來(lai)多(duo)少(shao)(shao)算力。

當算(suan)力(li)“口子”被外部(bu)技(ji)術(shu)、內部(bu)預算(suan)等限定，通過調度提升既有(you)資源利用效率，就成為企(qi)業“可控”的價值創造過程。特別是私域大(da)(da)模(mo)型，對于企(qi)業來(lai)說，AI大(da)(da)模(mo)型的大(da)(da)小需要平衡算(suan)力(li)和能耗的開支(zhi)，應選(xuan)擇適(shi)合行業特點(dian)和業務特點(dian)的大(da)(da)模(mo)型進行私域部(bu)署。

此時，如何榨取硬件資(zi)源提(ti)供(gong)的每一滴能力，加速模(mo)型的訓練速度成為首要考慮的問題，而這方面(mian)術業有(you)專(zhuan)攻，往往依賴基(ji)礎(chu)設(she)施服務(wu)廠商——針對算(suan)力等底層基(ji)礎(chu)設(she)施提(ti)供(gong)支撐(cheng)成為考驗各個(ge)服務(wu)廠商最基(ji)本的能力，其中尤以算(suan)力調度能力是(shi)其重點。

算(suan)(suan)力(li)調度(du)(du)往(wang)往(wang)需要多維能(neng)力(li)協同，所(suo)以(yi)，作(zuo)為業內首倡私域大(da)模型(xing)的(de)(de)(de)新(xin)華三給出了自己的(de)(de)(de)回答：依(yi)托通過傲飛(fei)算(suan)(suan)力(li)平(ping)(ping)臺實現算(suan)(suan)力(li)調度(du)(du)的(de)(de)(de)“最(zui)優解(jie)”，讓算(suan)(suan)力(li)可以(yi)最(zui)大(da)化的(de)(de)(de)按需調度(du)(du)。另一方(fang)面以(yi)綠洲(zhou)平(ping)(ping)臺實現大(da)模型(xing)所(suo)需的(de)(de)(de)數(shu)據支撐，同時在分布式訓練等需求下以(yi)智(zhi)能(neng)無損網絡(luo)支持AI集群(qun)訓練，配備高(gao)性能(neng)存儲帶來更(geng)好的(de)(de)(de)底層(ceng)存儲支撐，甚(shen)至(zhi)還(huan)建設有液冷(leng)數(shu)據中心(xin)來維持算(suan)(suan)力(li)輸出的(de)(de)(de)穩定性，以(yi)此構(gou)成一套完整的(de)(de)(de)智(zhi)算(suan)(suan)解(jie)決方(fang)案(an)。

而新華三算力(li)(li)調(diao)度的(de)“主(zhu)腦”傲(ao)飛(fei)算力(li)(li)平臺則具備異構計算資(zi)源統一管理、多元算力(li)(li)資(zi)源智(zhi)(zhi)(zhi)能調(diao)度的(de)能力(li)(li)，提供包(bao)含智(zhi)(zhi)(zhi)能標注、智(zhi)(zhi)(zhi)能訓練、智(zhi)(zhi)(zhi)能調(diao)優、智(zhi)(zhi)(zhi)能部署、智(zhi)(zhi)(zhi)能推理的(de)全(quan)流(liu)程算力(li)(li)智(zhi)(zhi)(zhi)能調(diao)度能力(li)(li)。

按官(guan)方數據，該平臺能(neng)夠將算(suan)力(li)利用率提高至(zhi)70%以上(shang)。同時(shi)，還支持8000節點的(de)算(suan)力(li)調度(du)，并發訓練時(shi)間縮短至(zhi)50%，且斷(duan)點自動接續無感知訓練更穩定，在既有GPU資源(yuan)下能(neng)全(quan)方面(mian)提升大模型(xing)訓練性能(neng)。

說白了(le)，就是通過(guo)一(yi)系列(lie)算(suan)力流程(cheng)環節(jie)的銜接優化(尤(you)其(qi)是面對并(bing)行計算(suan)與(yu)分布式計算(suan)需(xu)求(qiu))，在充分保障訓(xun)練與(yu)應用需(xu)求(qiu)的同時(shi)降低GPU的空閑時(shi)間(jian)，讓巨大成本獲取來(lai)的算(suan)力資源(yuan)工作盡可能飽和。

總體而言(yan)，這一整套(tao)高(gao)性能算(suan)力(li)集群及調度讓客戶能夠(gou)實(shi)現算(suan)力(li)、存力(li)、運力(li)協同感知，實(shi)現算(suan)力(li)資源充分供給、靈(ling)活部署、異構算(suan)力(li)最優調度——雖然有多少算(suan)力(li)資源很難(nan)控制，但(dan)用好這些資源企(qi)業卻能夠(gou)做到完(wan)全可控。

當(dang)然，除了提升算力利(li)用效率，行業中一些做法還(huan)在試(shi)圖通過其他(ta)方式直接降(jiang)低模型(xing)訓練(lian)對(dui)GPU資源的要求，例如數(shu)據存(cun)儲(chu)層面進行算子優(you)化等，未來或也存(cun)在較大的價值(zhi)開發空間。

數據“斷面化”，以數據質量建設

帶來“護城河”成為企業的必然選擇

目前，企業能夠獲得的數(shu)據量(liang)來源主要包括公開的數(shu)據集與(yu)自身(shen)沉(chen)淀(dian)。

在當下(xia)時間(jian)斷面，這兩(liang)種都只能被動等待(dai)或由時間(jian)積累，數據“量”其實很難有(you)突破，優勢(shi)有(you)就是有(you)，沒有(you)就是沒有(you)，并不可(ke)控。

當(dang)然(ran)，也有(you)一些企業試圖主(zhu)動(dong)出擊，例如國外公司(si)Inflection AI以大規模提問的方式來主(zhu)動(dong)提升(sheng)數據沉淀速度，但這(zhe)顯然(ran)這(zhe)并不會是主(zhu)流(liu)。

“量”上(shang)不可控(kong)，則(ze)可控(kong)的價(jia)值創造空間必須更聚焦于(yu)“質(zhi)”上(shang)。

中信(xin)智(zhi)庫《人工智(zhi)能十(shi)大發展趨(qu)勢(shi)》認(ren)為，“未來(lai)一個模型的(de)好壞，80%由數(shu)據質量決(jue)定。”

從長遠(yuan)視角看，大(da)模(mo)型(xing)的競爭并不(bu)是要(yao)比(bi)(bi)誰跑得更快，而是比(bi)(bi)誰走得更遠(yuan)，這就需要(yao)大(da)模(mo)型(xing)真實的應用效(xiao)果，也就需要(yao)通過(guo)各種方式提升數據質量，來鍛造大(da)模(mo)型(xing)發展(zhan)的“內功”。

在(zai)數(shu)據(ju)的(de)(de)(de)計劃、獲取、存儲(chu)、共享、維護、應用等環節，都需要針對(dui)性的(de)(de)(de)數(shu)據(ju)管理、治(zhi)理，最終提升(sheng)數(shu)據(ju)質量。這是(shi)一個系統(tong)性工程，也(ye)為(wei)市面上的(de)(de)(de)基礎設施(shi)服務(wu)商們帶來了(le)機(ji)會。

例(li)如(ru)新華三的綠洲平(ping)(ping)臺就以場景需求為導向，打(da)造(zao)了(le)一個圍繞數據(ju)采集、存儲、管理和應(ying)用的全(quan)棧(zhan)數據(ju)平(ping)(ping)臺。

通過(guo)內置(zhi)AI算法，綠洲平臺大(da)大(da)提升了數(shu)據(ju)標(biao)記能力(li)，讓數(shu)據(ju)治理、數(shu)據(ju)開發等(deng)過(guo)去很繁雜(za)的流程工作(zuo)變得(de)極(ji)為(wei)(wei)簡單，而(er)知(zhi)識圖譜構(gou)建能力(li)則(ze)幫(bang)助(zhu)數(shu)據(ju)躍升為(wei)(wei)知(zhi)識，從而(er)能夠(gou)更好地(di)被業務場景所使用。

事實上，數(shu)(shu)據(ju)深加工(gong)帶來(lai)高(gao)質量數(shu)(shu)據(ju)訓(xun)練(lian)(lian)一(yi)直是前沿大(da)模型(xing)的(de)核心競爭(zheng)力(li)所在，OpenAI一(yi)貫(guan)公開其(qi)訓(xun)練(lian)(lian)過程及(ji)算(suan)法(fa)，但對數(shu)(shu)據(ju)如何處理(li)緘口(kou)不言。

回(hui)過頭來看，數據(ju)(ju)(ju)的(de)(de)“要素(su)(su)化”與“資產化”正在讓百行百業(ye)再次(ci)審視數據(ju)(ju)(ju)的(de)(de)價(jia)值(zhi)(zhi)，在數據(ju)(ju)(ju)越來越作為(wei)一種新型生產力要素(su)(su)的(de)(de)時代，大(da)模型的(de)(de)本質可以視作一種挖掘(jue)數據(ju)(ju)(ju)要素(su)(su)價(jia)值(zhi)(zhi)的(de)(de)工具(ju)，而工具(ju)不(bu)決定價(jia)值(zhi)(zhi)，只決定效(xiao)率(lv)。

大模型終將走入底層成為(wei)一(yi)種(zhong)普遍(bian)的(de)(de)后端能力，技(ji)術本身越(yue)來(lai)越(yue)無(wu)法(fa)成為(wei)護城(cheng)河，而數據則代表了(le)企業在前端與客戶/用戶的(de)(de)連接程度，數據要素的(de)(de)價值釋(shi)放將成為(wei)企業真正的(de)(de)“護城(cheng)河”。

所有的(de)數(shu)據(ju)類平臺提升數(shu)據(ju)質量的(de)過(guo)程，就是在幫助企(qi)業進一步挖(wa)掘(jue)數(shu)據(ju)要素價(jia)值、沉淀數(shu)據(ju)資產，真正打造企(qi)業的(de)“護城河”。

算法“收斂化”，

殊途同歸下企業需聚焦訓練效率提升

算(suan)法(fa)是大模型(xing)的能力核心，但(dan)長期來看(kan)，算(suan)法(fa)能力卻終將“收斂”。

目(mu)前的大模(mo)型(xing)算(suan)法基(ji)本(ben)上都基(ji)于(yu)Transformer架(jia)構，該架(jia)構解決了過去RNN架(jia)構難以并(bing)行(xing)化等(deng)核心缺陷(xian)，是(shi)基(ji)因“優勝劣(lie)汰”的結果，BERT、GPT、T5、GLM等(deng)都其“衍生品”。

所以，算法(fa)生來都幾乎有著相同的“基因”。

而在開發(fa)框架層面，伴隨著開源生態(tai)建設，國外的(de)TensorFlow、Pytorch，國內的(de)MindSpore等幾個主流框架逐步成為共同的(de)選擇。

這(zhe)意味著(zhu)，算法的(de)后天的(de)“成長環境”也逐步趨同(tong)。

先天(tian)(tian)+后天(tian)(tian)，算法創新當下看起來百花齊放，但在未來其價值創新的空間將(jiang)逐步收(shou)窄，企業能夠通過努(nu)力獲得的相對優勢將(jiang)越來越少。

甚至(zhi)，在Llama 2掀起的開源(yuan)浪潮(chao)下，算(suan)法創新的價值被進一步壓縮(suo)。

因此(ci)，從長(chang)期來看，企業最“可(ke)控”的價值創造將(jiang)側重到(dao)訓練效率而非(fei)算(suan)法創新(xin)上——同(tong)樣的能(neng)力與潛力，PK更快速地訓練迭代(dai)。

很(hen)多廠商(shang)提供的(de)開發工具鏈(lian)都在(zai)直(zhi)接(jie)推進訓練效率，而一些原本旨在(zai)提供算(suan)力服務的(de)平臺也(ye)實現了等價的(de)功能。

例如，傲飛算力(li)平臺支(zhi)持斷點自動(dong)接續無(wu)感知訓練，其原(yuan)本目的在于降低參數迭代期間的GPU資(zi)源等待、提升資(zi)源利用效(xiao)率，但(dan)客觀上也直(zhi)接帶來訓練效(xiao)率的提升，讓算法加速迭代，先把潛力(li)跑出(chu)來。

畢竟，加(jia)速算(suan)法訓練(lian)，就是(shi)在提升算(suan)力資源利用效率。

行業規則“沉淀化”：

長期主義仍需回歸到正確的價值觀

大模型熱潮中(zhong)，人人都(dou)會不自覺追求(qiu)技術與商業(ye)價(jia)值“上限”，但大模型“下限”問(wen)題也日益突出(chu)，例如數據隱私、數據安全、知識產權、技術濫用等。

從企(qi)業的視角(jiao)看，行業規則建立迫在(zai)眉睫(jie)，但其形(xing)成過(guo)程同樣(yang)存在(zai)著不由企(qi)業決定的“客觀因素”。

關于行(xing)業發展的一些法(fa)律(lv)法(fa)規，監管(guan)部門在逐步沉淀(dian)，例如國家(jia)網信辦聯合(he)多部門公布的《生成式人工智能服(fu)務管(guan)理(li)暫行(xing)辦法(fa)》，企業要做的是(shi)等(deng)待并盡(jin)力(li)配(pei)合(he)與落實。

關于行業(ye)統(tong)一(yi)共識，也需要一(yi)個個沉(chen)淀(dian)，例如，目(mu)前已經有從業(ye)者(zhe)提議行業(ye)協作(zuo)開發統(tong)一(yi)、可信的(de)框架，在隱私(si)保護(hu)、模型效用(yong)和訓(xun)練(lian)效率之間取得平衡，企業(ye)要做(zuo)的(de)是積(ji)極(ji)響應、積(ji)極(ji)參與。

但在一些規則(ze)上，企業能(neng)夠(gou)、也必(bi)須充分發揮“可(ke)控”的(de)價值創造能(neng)力(li)。

例如(ru)，大模型數(shu)據安全“容(rong)錯率低”，企(qi)業必須加大投入。

很多基(ji)礎設施廠(chang)商都提供(gong)了相(xiang)關(guan)的服(fu)務(wu)，例(li)如新(xin)華三的私域大模型百業靈犀以內置安全限制(zhi)提示詞和出(chu)入(ru)內容(rong)過濾攔截(jie)對所有場(chang)景(jing)下大模型生成(cheng)內容(rong)進(jin)行安全性限制(zhi)，針對所有出(chu)入(ru)流量(liang)和內容(rong)進(jin)行安全審計和敏感信息攔截(jie)。

當然，最直(zhi)觀反應大(da)模型倫理、體現“下限”的(de)是場景應用的(de)選(xuan)擇問(wen)題。

科研、制造、醫藥(yao)、法律……大模型已(yi)經走向(xiang)諸多能帶來社會(hui)正向(xiang)價(jia)值的(de)場(chang)景。但是，諸如(ru)偽造視頻進行詐騙(pian)等“場(chang)景應用”也已(yi)經出(chu)現，基于強力(li)的(de)大模型技術(shu)有著(zhu)更強的(de)欺(qi)騙(pian)性。

技(ji)術是(shi)刀，大模(mo)型是(shi)一把更鋒利的(de)刀，它的(de)作用(yong)(yong)和價值由(you)使用(yong)(yong)的(de)人決定。

說到底，企(qi)業需(xu)要構(gou)建正(zheng)確的(de)價值觀(guan)，將大模(mo)(mo)型能(neng)力導(dao)向數字經濟的(de)正(zheng)向價值上，才能(neng)守(shou)住“下(xia)限”、實現大模(mo)(mo)型的(de)長期健康發展。

結語

大(da)模型賽道上，企(qi)業必(bi)須在“可(ke)控”的價值創造(zao)空間上發力，才能不斷在各個維度獲得(de)更多(duo)相(xiang)對(dui)競爭優勢與發展可(ke)能性。

企業(ye)也必須以此為標準選擇基礎(chu)設(she)施(shi)服務、大(da)模型服務的(de)廠(chang)(chang)商，尤其(qi)是在(zai)多個維度都(dou)能滿足(zu)需(xu)要(yao)的(de)廠(chang)(chang)商。

可以說，大模型給了這個時代(dai)全新的(de)增量價(jia)值方(fang)向(xiang)，只有(you)幫助企業(ye)實現對(dui)“可控”價(jia)值創造的(de)把握，才(cai)能(neng)讓企業(ye)在(zai)這個全新方(fang)向(xiang)更有(you)著(zhu)力(li)點。

人工智能大模型

評論

還可輸入300個字

發布留言

2018高清国产一区二区三区-国产黄色视频免费在线观看-欧美激情欧美精品一区二区-免费国产一级片内射老妇