48728 歷史進程中的英偉達

2018高清国产一区二区三区-国产黄色视频免费在线观看-欧美激情欧美精品一区二区-免费国产一级片内射老妇

服務熱線:400-858-9000 咨詢/投訴熱線:
國內專業的一站式創業服務平臺
歷史進程中的英偉達
2023/09/29
成功引起自滿,自滿導致失敗,只有偏執狂才能生存。
本文來自于微信公眾號“新立場NewPosition”(ID:xinlichangNP),作者:B 哥,編輯:李凡,投融界經授權發布。

1993年(nian)4月5日,黃仁勛這天剛好滿(man)30歲,和(he)普里姆(mu)以及馬拉喬夫斯基(ji)三人(ren),在(zai)加州(zhou)圣何(he)塞一家連鎖餐(can)廳(ting)里討論(lun)著創業成立公司(si)的事。

這(zhe)家(jia)丹尼餐(can)廳位于一座立交橋旁邊,環境(jing)吵(chao)鬧同時裝(zhuang)修簡陋(lou),店(dian)鋪的(de)前(qian)臉布滿了彈孔,因為路過(guo)的(de)社會人(ren)經常朝停在門(men)前(qian)的(de)警車開槍。三個創始人(ren)此時正(zheng)拿(na)雞蛋(dan)卷裹香腸片,就(jiu)著劣質(zhi)焦咖(ka)啡(fei),英偉達就(jiu)在這(zhe)樣(yang)的(de)環境(jing)下誕(dan)生了。

黃仁勛出(chu)生(sheng)在臺南囝仔,今天從這個地方(fang)往東(dong)北方(fang)向不到20公(gong)里,就是臺積電的第十八晶圓廠(chang)。

這(zhe)個生產(chan)基地2017年底開(kai)工(gong)建設,預計(ji)到今年的總(zong)投資額將超過(guo)1000億美元(yuan),是臺積電最(zui)昂(ang)貴的晶圓廠,其最(zui)先進(jin)的5納米和3納米制程在這(zhe)落地。無論是英偉達(da)的RTX4000系列游戲顯卡(ka),還是當下一卡(ka)難求的H100,都在這(zhe)里(li)完成從硅到芯片的關(guan)鍵轉(zhuan)化。兩家公司相互成就,如今共同掌(zhang)握著尖頂星科技,市(shi)值合計(ji)1.5萬億美元(yuan)。

從成立之日算起,黃仁(ren)勛在(zai)英偉達CEO位(wei)置上干了整整三(san)十年(nian)。論敬業程度,硅谷同行(xing)里大(da)概少有人(ren)能出(chu)其右。

在硅(gui)谷(gu)敘事(shi)模式里(li),這里(li)成(cheng)功(gong)的(de)科(ke)技公(gong)司(si)通常在年(nian)輕創始人帶領(ling)下(xia)迅速成(cheng)長為(wei)世(shi)界巨頭(tou)(tou),或者(zhe)已經成(cheng)為(wei)世(shi)界巨頭(tou)(tou)的(de)公(gong)司(si)因為(wei)跟不上形勢而快速沒落,又或者(zhe)沒落后又再次憑借某個(ge)拳頭(tou)(tou)產(chan)品重(zhong)新(xin)變(bian)得偉大(da)。總之來(lai)來(lai)回(hui)回(hui),興也(ye)勃焉(yan)亡也(ye)忽焉(yan),核心(xin)就是一個(ge)快字(zi)。

以這(zhe)樣(yang)的視角打量,英偉(wei)達顯(xian)然(ran)不(bu)太一樣(yang)。除了(le)在最初創業時(shi)差(cha)點(dian)“暴斃”,英偉(wei)達在長(chang)達二十年(nian)的時(shi)間(jian)里活得相當寧(ning)靜,談不(bu)上驚艷(yan)但也沒(mei)遭遇(yu)大災(zai)大難(nan)。

直到最近幾年,英(ying)偉達突然開掛爆種(zhong),從人(ren)工智能(neng)到加(jia)密貨幣(bi),從元宇宙(zhou)到ChatGPT,不是英(ying)偉達在(zai)追(zhui)風口,而更(geng)像(xiang)是風口失了智般往英(ying)偉達身上撞(zhuang)。

作(zuo)為(wei)總設計師(shi),黃仁勛(xun)本人(ren)顯然不(bu)會認(ren)可這種(zhong)說法。在他那里,英偉達的故事應該是(shi)關于技術理解、商業遠見和長期主義(yi)的絕佳范(fan)例(li)。

頂多再(zai)加一(yi)點小小的(de)運氣。

01、東亞的風瞇了黃仁勛的眼

黃(huang)仁勛和另外兩個(ge)合伙人(ren)最終決定創(chuang)業時,有著相當樸素但又(you)同時觸及(ji)本(ben)質(zhi)的思考。無論電(dian)影(ying)、電(dian)視或(huo)者印刷的書籍報紙,抑(yi)或(huo)是音樂,這(zhe)些都(dou)是人(ren)類用來表達(da)想法(fa)講述故事的媒介。

而(er)當時正顯(xian)露雛形的3D圖像技術,憑借實時生成的畫面和互動性,將(jiang)有可能成為下一種(zhong)新的大眾媒介。

唯一的問題是此時的3D圖(tu)像任(ren)務(wu),由于需(xu)要耗(hao)費極(ji)高的計算量(liang),只有使(shi)用極(ji)其龐(pang)大的專業(ye)工作站(zhan)才(cai)能完成。而黃仁勛和英(ying)偉達想要做的,就是把(ba)這項技術變(bian)得足(zu)夠便宜,然后普及它(ta)。

事實(shi)上,1993年(nian)英(ying)偉達成(cheng)立的(de)時候,它是第一家嘗試把3D圖像推向普通消(xiao)費者的(de)公(gong)司。不過首先做到這件事的(de)公(gong)司并不是英(ying)偉達,索尼在(zai)(zai)一年(nian)零八個(ge)月(yue)后(hou)推出的(de)初代PS游戲主(zhu)機要成(cheng)功得多(duo),在(zai)(zai)推出九年(nian)后(hou),這款主(zhu)機出貨量突破了1億臺。

另一方(fang)面(mian),英偉(wei)達前期的先(xian)發優勢很快就不復存(cun)在(zai),短短兩(liang)年(nian)時(shi)間(jian)里極客遍地的硅谷就冒出了(le)90家英偉(wei)達的競爭者。而(er)在(zai)這兩(liang)年(nian)時(shi)間(jian)里,市場形勢已經發生了(le)翻(fan)天覆(fu)地的變(bian)化,問題(ti)出在(zai)DRAM這個元(yuan)器件(jian)上面(mian)。

從技術原(yuan)理(li)上(shang)說(shuo),圖(tu)(tu)像(xiang)在計算機(ji)內部的(de)(de)存儲(chu)需(xu)要(yao)消(xiao)耗相當(dang)大的(de)(de)空間(jian)資源。在未經(jing)壓縮的(de)(de)情況下(xia),如今一張(zhang)1080P的(de)(de)圖(tu)(tu)片(pian)含(han)有超過兩百萬像(xiang)素(su)點(1920 × 1080),按照8比(bi)特的(de)(de)色(se)深,每個(ge)像(xiang)素(su)點需(xu)要(yao)4個(ge)字節的(de)(de)存儲(chu)空間(jian),所有像(xiang)素(su)點合計超過8M字節。而要(yao)產生動態連續的(de)(de)觀感,屏幕上(shang)顯示的(de)(de)圖(tu)(tu)像(xiang)還(huan)需(xu)要(yao)保持每秒多次(ci)刷新。

盡(jin)管(guan)在(zai)(zai)30年(nian)(nian)前屏幕的顯示規格,無論是說分辨(bian)率還(huan)是色彩還(huan)沒有這么(me)高,但存(cun)儲空間仍(reng)然(ran)是在(zai)(zai)算力之外(wai)3D圖像技術的關鍵瓶(ping)頸。在(zai)(zai)英偉達成立的1993年(nian)(nian),DRAM內(nei)存(cun)的價格在(zai)(zai)50美(mei)元/MB這個(ge)水平,主流VGA顯示器的分辨(bian)率則是640*480。

即便使(shi)用當(dang)時最(zui)先進的(de)解(jie)決方案,3D圖像(xiang)顯示所需要(yao)的(de)DRAM也得(de)4MB,所以(yi)單單是這(zhe)塊DRAM的(de)成本(ben)就需要(yao)200美元(yuan)。

加(jia)上板上的(de)(de)控制芯片和(he)其(qi)他組件,再(zai)算上一定的(de)(de)利潤(run)空間(jian),最終這(zhe)(zhe)些(xie)產品(pin)的(de)(de)定價得要1000美元往上。雖然今天游戲玩家花大幾千(qian)或者上萬的(de)(de)價格買張顯卡還處在(zai)可以(yi)理(li)解的(de)(de)范疇,但這(zhe)(zhe)是因為圍繞這(zhe)(zhe)張顯卡已(yi)經(jing)建(jian)立起了豐富的(de)(de)生態。而(er)在(zai)30年前是沒(mei)有這(zhe)(zhe)么(me)多所謂的(de)(de)3A大作的(de)(de),消費級市場不會有人愿意(yi)花這(zhe)(zhe)么(me)多錢買個(ge)電子元件回(hui)來當擺(bai)設。

所(suo)以黃仁(ren)勛他們圍繞DRAM搞了(le)技術創(chuang)新,使得英偉達產(chan)品需(xu)要(yao)的內(nei)存空間大大降低,從紅杉那里融到(dao)的1千萬美元(yuan)(yuan)很大部(bu)分也都(dou)花在了(le)這(zhe)個“遙(yao)遙(yao)領先”的解決方案上。黃仁(ren)勛本(ben)來以為這(zhe)會給他們的產(chan)品帶來差(cha)異化(hua)的競爭力,但到(dao)創(chuang)業的第二年,DRAM的價格(ge)就從單(dan)價50美元(yuan)(yuan)跌到(dao)了(le)5美元(yuan)(yuan)。

這意味著(zhu)英偉達前期瞄著(zhu)內存優化做的(de)巨(ju)大投入完全打了(le)水漂。

后來的(de)幾乎所有文章都(dou)把英偉達(da)NV1這(zhe)款產品的(de)失(shi)敗,歸結到(dao)跟OpenGL路線的(de)三角渲染模式不(bu)兼容上面,但(dan)實際(ji)上不(bu)兼容并不(bu)是NV1失(shi)敗的(de)真(zhen)正原因。給NV1造(zao)成致(zhi)命打擊的(de),是內存價格暴(bao)跌把NV1從(cong)先進(jin)(jin)變成了不(bu)先進(jin)(jin),而一款不(bu)先進(jin)(jin)的(de)產品并沒有機會(hui)參與行業標準(zhun)的(de)塑造(zao),最終的(de)不(bu)兼容其實是結果而非原因。

DRAM價格暴跌的(de)原因(yin)是(shi)供過于(yu)求,新產能的(de)主要(yao)貢獻者是(shi)亞洲(zhou)人(ren)。在九十(shi)年代(dai),韓國和(he)臺灣的(de)經(jing)(jing)濟都(dou)出(chu)現了(le)爆發(fa)性增(zeng)長(chang),兩家(jia)的(de)經(jing)(jing)濟模(mo)式都(dou)是(shi)出(chu)口導向(xiang),支(zhi)柱產業是(shi)電(dian)子和(he)半導體。以韓國為例,在政府(fu)支(zhi)持下,幾家(jia)財閥(fa)借助從銀行獲得的(de)貸款(kuan)大量進行資本開支(zhi),生產規模(mo)迅速擴張。僅韓國內存行業產能在1991到1995的(de)短短幾年里(li)就增(zeng)長(chang)了(le)8.3倍。

由于行業特性,內存晶圓(yuan)廠(chang)需(xu)要(yao)保持很(hen)高的(de)產能(neng)(neng)利用率才能(neng)(neng)攤平固定成(cheng)本。內存廠(chang)商甚至會(hui)在明(ming)知供給(gei)遠超需(xu)求的(de)情(qing)況下繼續(xu)生產,這進(jin)一步推低了(le)產品(pin)價格。不過這些余波對(dui)黃(huang)仁勛而言已經不重要(yao)了(le),因為此刻的(de)英偉達要(yao)拋掉(diao)過去另起新灶了(le)。

02、英特爾不是對手,是黑洞

在NV1發(fa)布的兩年后,英(ying)偉(wei)(wei)達(da)迎來了第一款(kuan)成功的產(chan)品:RIVA128。RIVA128這塊產(chan)品標志著英(ying)偉(wei)(wei)達(da)在技術路線上的重(zhong)大轉向,英(ying)偉(wei)(wei)達(da)徹底(di)放棄了之前與行業不兼容的解決方(fang)案,選擇全面擁(yong)抱(bao)Direct3D和(he)OpenGL的技術規(gui)范。

這個時候3Dfx公司生產的(de)(de)Voodoo顯卡已(yi)經成(cheng)為行業標桿,而(er)剛推出(chu)的(de)(de)RIVA128由于驅(qu)動問(wen)題在圖像質量上(shang)跟Voodoo有(you)明顯差距。

不(bu)過英偉達通過后續的固(gu)件(jian)更新,很快(kuai)使RIVA128輸出的圖像畫(hua)質趕上甚至(zhi)超越(yue)Voodoo。在這(zhe)種情況下(xia),RIVA128兩個設計優勢就(jiu)體(ti)現了出來。

一(yi)(yi)方面,大概是前期走自(zi)主路線(xian)累積的(de)(de)技術基礎,英偉(wei)達在RIVA128上通過(guo)特殊的(de)(de)內存架(jia)構設(she)計,使得(de)其能夠輸(shu)出更(geng)高分辨(bian)率的(de)(de)圖像(xiang)。另(ling)一(yi)(yi)方面,跟(gen)Voodoo顯(xian)卡不同,RIVA128同時集成了(le)2D和3D圖形芯片,這使得(de)插(cha)RIVA128的(de)(de)電腦不需要一(yi)(yi)張單獨的(de)(de)2D顯(xian)卡來處理輸(shu)出。

接下來的(de)(de)(de)時(shi)間(jian)里(li),RIVA128及其(qi)改款(kuan)產(chan)品(pin)幫助英偉達在(zai)(zai)顯卡(ka)市場站(zhan)穩(wen)了腳跟。1999年(nian),英偉達發布了第一(yi)款(kuan)GeForce系列產(chan)品(pin):GeForce256。盡管在(zai)(zai)這(zhe)之前其(qi)實(shi)已經有(you)了類似(si)的(de)(de)(de)概念(nian),但(dan)英偉達仍然把GeForce256稱之為(wei)“世界(jie)上第一(yi)款(kuan)GPU”,GPU這(zhe)個新潮的(de)(de)(de)詞(ci)匯走向(xiang)大眾化也是從這(zhe)開始的(de)(de)(de)。

GeForce256的確算得上(shang)是一張劃時代的GPU,它第一次(ci)把多邊形轉換與(yu)光(guang)源處理(T&L)相(xiang)關的幾何計(ji)算從CPU肩上(shang)解放了(le)出來。

這里我們(men)(men)不妨對芯片特點做個(ge)(ge)簡單的(de)科普。所有(you)的(de)芯片大致可(ke)以分成(cheng)兩(liang)個(ge)(ge)類型,通才(cai)和專才(cai)。通才(cai)類型的(de)芯片就是CPU,它們(men)(men)是不折不扣的(de)多面(mian)手,能夠執行各(ge)種通用普遍的(de)計算任務。而GPU則更接近專才(cai),它們(men)(men)就像精通某(mou)項技(ji)藝的(de)大國工匠,擅(shan)長于把聚焦(jiao)范圍內的(de)任務做到極(ji)致。

而芯片行業歷史(shi)上的(de)一(yi)個大趨勢(shi),就是(shi)由(you)于(yu)摩爾定(ding)律的(de)存(cun)在(zai),CPU能做的(de)事(shi)情越(yue)來越(yue)多,性(xing)能也越(yue)來越(yue)強。這就導致很多計算任(ren)務(wu)開始是(shi)由(you)專有設備完成的(de),但當這些任(ren)務(wu)變得普遍同時(shi)又(you)趨于(yu)穩定(ding)的(de)時(shi)候,把它們集(ji)成進CPU就是(shi)水到渠(qu)成的(de)轉(zhuan)折(zhe)。

這(zhe)(zhe)個(ge)過程(cheng)中,CPU廠(chang)商加強(qiang)了(le)產品(pin)競(jing)爭力,消費者因為(wei)集成獲得了(le)性價(jia)比,只有原來這(zhe)(zhe)些專(zhuan)有廠(chang)商被(bei)掃進(jin)(jin)了(le)歷(li)史的(de)垃(la)圾(ji)堆:通才型芯片像(xiang)個(ge)黑洞一樣,把專(zhuan)才芯片吸納(na)進(jin)(jin)去。

比如(ru),密碼(ma)學作為現(xian)代網絡通信的關鍵基礎設施,初期就是靠(kao)單獨的集成電路實現(xian)的,后來變成了(le)CPU的幾條指(zhi)令。其(qi)他像音頻(pin)卡、視頻(pin)卡之類的產品,也都重復了(le)類似(si)的發展路徑。

在這(zhe)個背(bei)景下(xia),再來看GeForce256將T&L計算(suan)任務從(cong)CPU那(nei)里拿過來的操作,就有了非(fei)同一(yi)般的象征意義(yi)。因為從(cong)行業發展方向來說,這(zhe)是跟(gen)我們(men)上面描述的“通才吸(xi)納(na)專才”這(zhe)個過程完全(quan)相反的動作。

作為芯片行(xing)(xing)業一個剛剛起步的(de)玩家,在(zai)看(kan)到那些同行(xing)(xing)前赴后繼的(de)悲慘命(ming)運過后,黃(huang)仁勛明白只(zhi)有(you)創造獨特價(jia)值,企業才有(you)長期存(cun)在(zai)的(de)可(ke)能。

幸運的是,跟密碼(ma)學或者普通的音視(shi)頻解碼(ma)相比(bi),3D圖(tu)像領域有(you)著高得多的天花板。普通用戶總(zong)是在期待畫面質量更加(jia)精致,圖(tu)像刷(shua)新速率(lv)更高,這帶(dai)來了對(dui)GPU性能的追求。而(er)反過來當GPU對(dui)現有(you)需求進行回應后,又會再度(du)激發新的需求,這構成(cheng)了長期維(wei)持的正向循(xun)環激勵。

直到現在(zai),最旗艦GPU往往也只(zhi)是(shi)剛好(hao)滿足最苛刻3A游(you)戲的性能需求(qiu)。同時,像元宇(yu)宙這類新的應用前景,已經因為觸及現有的算力瓶頸而難以到達。

所以現實的(de)情(qing)況總是,即便核顯(xian)達到了幾年(nian)前獨立GPU的(de)性(xing)能,英(ying)偉達新的(de)GPU又與之拉(la)開(kai)了顯(xian)著的(de)差距。對(dui)英(ying)特爾而言,在很(hen)長一(yi)段時間里(li)它(ta)(ta)其實算不上英(ying)偉達的(de)對(dui)手,因為它(ta)(ta)并(bing)(bing)(bing)不想進入并(bing)(bing)(bing)主導GPU這個行業,而是在等待吞并(bing)(bing)(bing)并(bing)(bing)(bing)消滅這個行業,就像它(ta)(ta)曾經(jing)多次做到的(de)那樣。

03、漫長季節里長出的CUDA

到(dao)目前為止的30年里(li),除了創立初期那(nei)段時間,此(ci)后(hou)(hou)的英(ying)(ying)偉(wei)達(da)幾乎再也沒有(you)遇(yu)到(dao)過生死存亡(wang)的危(wei)急時刻(ke)。在(zai)把昔日巨頭3Dfx收入囊中過后(hou)(hou),GPU行業(ye)進(jin)入了英(ying)(ying)偉(wei)達(da)/ATI寡頭壟斷(duan)時代。隨后(hou)(hou)十幾年里(li)英(ying)(ying)偉(wei)達(da)的市場份額(e)穩步提升(sheng),但整體營收則(ze)在(zai)2008年達(da)到(dao)40億美(mei)元過后(hou)(hou),緩(huan)慢振蕩提升(sheng),最(zui)終在(zai)2016年才艱(jian)難到(dao)達(da)50億美(mei)元的里(li)程碑。

與之(zhi)對應(ying)的是(shi),在2016年之(zhi)前(qian),英偉(wei)達的股價(jia)保持在10美(mei)元以下的區間(jian)隨業績表現浮動(dong)。這是(shi)一段(duan)漫長的季(ji)節,過程中(zhong)黃仁(ren)勛(xun)帶(dai)領(ling)同(tong)事做了辛(xin)勤(qin)的嘗試,英偉(wei)達龐大(da)帝國的地基(ji)在此期間(jian)悄然建立(li)。

我(wo)們在上個部分曾(ceng)經談過(guo),為了避免(mian)被集成(cheng),造GPU的英偉達需(xu)要跑(pao)得比造CPU的英特爾更(geng)快。這(zhe)個目標(biao)是通(tong)過(guo)造更(geng)強(qiang)大的芯片,同時向開發者群體提供(gong)更(geng)多能有效利(li)用(yong)這(zhe)些(xie)強(qiang)大芯片的工具棧來實現的。

這(zhe)個群體里比(bi)例最大的(de)一部分(fen)是游(you)戲開發(fa)者,所以英偉達(da)發(fa)明了可(ke)編程著色(se)器(programmable shader)這(zhe)樣(yang)的(de)技術,來使得(de)游(you)戲開發(fa)在畫面(mian)呈現上有更多的(de)靈活度和特色(se)。

黃仁勛本(ben)人把可編(bian)程著色器(qi)視為英偉(wei)達史(shi)上最關鍵的(de)(de)創新之(zhi)一,它擴(kuo)張了行(xing)業邊界,也(ye)正是(shi)這(zhe)項(xiang)技術使(shi)GPU能夠消(xiao)耗(hao)掉越(yue)來(lai)越(yue)多的(de)(de)晶體(ti)管和算力,也(ye)就避免(mian)了被CPU或者主板(ban)上的(de)(de)芯(xin)片組集(ji)成(cheng)吞并。

但黃仁勛的(de)(de)技術遠見在于,他不只是帶著英偉(wei)達沿著計(ji)算圖形這條路走到底,還(huan)很早就看(kan)到了(le)GPU和CPU在計(ji)算范(fan)式上的(de)(de)本質區別(bie),并以極大的(de)(de)耐心和勇氣(qi)為此(ci)做了(le)充分的(de)(de)準備。

人們在(zai)進(jin)入千禧年后不久,其實就已經(jing)發現摩爾定(ding)律在(zai)逐步失效,因(yin)而多(duo)核CPU漸成趨(qu)勢。發展到今天(tian),頂(ding)級(ji)的(de)消費級(ji)CPU已經(jing)堆(dui)到16個物理(li)核心,服務器CPU甚至有高達128個物理(li)核心,因(yin)此面向CPU的(de)多(duo)線程并行編程早(zao)已變(bian)得相當普遍。

但CPU的(de)多核(he)(he)并行跟GPU出(chu)發點完(wan)全不同,多核(he)(he)CPU的(de)出(chu)現更多是(shi)為應對(dui)單核(he)(he)性能(neng)難以繼續保持大(da)幅提升(sheng)的(de)退而(er)求其次(ci),而(er)GPU從一開始方法(fa)論(lun)就是(shi)把大(da)問題分(fen)解(jie)成盡(jin)可(ke)能(neng)多的(de)小問題,然后再用(yong)盡(jin)可(ke)能(neng)多的(de)“弱”計(ji)算核(he)(he)心去解(jie)決這些小問題。

舉個(ge)例(li)子(zi),跟如今高端(duan)消(xiao)費(fei)級CPU的(de)16個(ge)核(he)(he)心(xin)相比,像4090這類(lei)高端(duan)的(de)消(xiao)費(fei)級GPU擁有超(chao)過16000個(ge)核(he)(he)心(xin),千倍的(de)量變顯(xian)然(ran)意味(wei)著質變。

以可編(bian)程著色器為代(dai)表(biao)的技術,只(zhi)是上述模式在圖形(xing)計(ji)算領(ling)域的應用(yong),將(jiang)其進(jin)一步推而廣之至通用(yong)計(ji)算領(ling)域將(jiang)有更廣闊(kuo)的新(xin)世界,而英(ying)偉達打開(kai)這個(ge)新(xin)世界的鑰匙就是CUDA。

用黃(huang)仁(ren)勛(xun)的話說,第一步是(shi)“make graphics programmable”, 第二步則(ze)是(shi)“open up GPU for programmability for all kinds of things”。

在(zai)英偉達推出CUDA之前,GPU編程是(shi)件(jian)非常麻煩的(de)事情,需要寫很多底層代碼。CUDA的(de)易用性使得(de)更廣泛(fan)的(de)人群成為開發者,釋放出GPU這(zhe)個計算平臺的(de)潛力(li)。但在(zai)英偉達的(de)每張(zhang)顯卡上都嵌(qian)入(ru)對CUDA的(de)支(zhi)持是(shi)種成本很高的(de)做法,CUDA體系(xi)的(de)研發和維護也都需要巨(ju)量的(de)資源投入(ru)。

不(bu)(bu)過無論黃仁勛如何苦口婆心地(di)闡述CUDA是項多(duo)么偉大的(de)(de)(de)創(chuang)新,華爾街的(de)(de)(de)分(fen)析師(shi)們并(bing)不(bu)(bu)買賬,所以英偉達的(de)(de)(de)股(gu)*長期保(bao)持在(zai)個位(wei)數美元(yuan)的(de)(de)(de)位(wei)置徘徊。站在(zai)今(jin)天(tian)往回看,當然會(hui)有人罵這群分(fen)析師(shi)身在(zai)寶(bao)山不(bu)(bu)識寶(bao)。不(bu)(bu)過分(fen)析師(shi)也(ye)有話說啊,畢竟(jing)這些年里科技公司吹過但沒實現(xian)的(de)(de)(de)牛逼太多(duo)了(le)。

04、失敗的Tegra,成功的Orin

2013年9月5日,雷(lei)軍(jun)在北京(jing)國家(jia)會議中心發(fa)布(bu)了第(di)三代小(xiao)米(mi)手機。黃(huang)仁(ren)勛當時(shi)作(zuo)為(wei)特邀嘉(jia)賓(bin),也來到了現場。當時(shi)小(xiao)米(mi)還沒有PC產品線(xian),黃(huang)仁(ren)勛來北京(jing)是為(wei)了給旗下的手機SoC站臺,小(xiao)米(mi)3的移動版用的是英偉達(da)Tegra4四核CPU。

盡(jin)管發布會(hui)上兩人談笑風生,但雷軍并沒(mei)有把寶全壓在(zai)英偉(wei)達上面,小米3的聯通和電信版都用的高通處(chu)理器(qi)。

這是(shi)英偉達(da)進軍移動(dong)計算領(ling)域的高光時刻,也是(shi)黃仁勛當時為(wei)英偉達(da)尋找的下個星辰(chen)大海。在智能手機浪潮興起后(hou),黃仁勛認為(wei)移動(dong)計算領(ling)域的蓬勃(bo)需求將(jiang)誘發一場革命(ming),這最終(zhong)甚至會反過來顛覆PC和服務(wu)器(qi)市場。

2011年初,黃仁(ren)勛(xun)接受(shou)科技媒體VentureBeat采訪時(shi)說(shuo)到,Tegra系列(lie)芯(xin)片將會使英偉達的有效市場擴大6倍。

不過在(zai)說完這(zhe)句話后,黃仁勛還順(shun)便跟了句諾基(ji)亞(ya)從塞班(ban)系統向Windows的(de)(de)轉(zhuan)型會是英偉達的(de)(de)“絕好機會”。除諾基(ji)亞(ya)之外,Tegra芯片的(de)(de)另一個關鍵(jian)客戶是摩(mo)托羅拉。旗(qi)下(xia)的(de)(de)安卓平(ping)板(ban)Motorola Xoom正是使(shi)用(yong)的(de)(de)Tegra2芯片。在(zai)蘋果的(de)(de)iPad2代500美元起售的(de)(de)情況(kuang)下(xia),Xoom這(zhe)款平(ping)板(ban)的(de)(de)定(ding)價達到了800美元。

事后(hou)來(lai)看,這(zhe)些細節大概已(yi)然預示(shi)了(le)英偉達Tegra產品線進入移動(dong)芯片市(shi)場將(jiang)遭(zao)受的失敗。

不過英(ying)偉達對Tegra的投(tou)入并非竹籃打水(shui),頗有(you)失之(zhi)(zhi)東(dong)隅收之(zhi)(zhi)桑(sang)榆的幸運感。在最終因為基(ji)帶問題徹底退出手機(ji)市場后,Tegra系(xi)列(lie)產品轉變了設計(ji)目標(biao),從此前瞄準功耗和(he)效(xiao)率(lv)的表(biao)現調(diao)整到專注于性能(neng)。

典型的(de)代表(biao)產品是Tegra X1,該款芯片被(bei)用在了任(ren)天(tian)堂(tang)的(de)Switch游(you)戲主(zhu)機上面,被(bei)認為帶(dai)來了優質的(de)畫面體驗。

更進(jin)一步(bu)的(de),研發Tegra系列芯(xin)片(pian)的(de)過程中,英偉達積累了豐富的(de)SoC開發經驗(yan),這(zhe)雖然最終沒(mei)能撬開移動市場(chang),但卻(que)幫助英偉達快速布局了智(zhi)能汽車時(shi)代。在采用軟硬件全棧自研之前,特斯拉汽車上就搭載的(de)Tegra X2芯(xin)片(pian)。

同時,當前(qian)高端智能汽車上(shang)標(biao)配的Orin芯(xin)片也是(shi)屬于(yu)Tegra這個系(xi)列。實際上(shang),目前(qian)英(ying)偉達服(fu)務于(yu)駕駛輔助(zhu)的“Nvidia Drive”和服(fu)務于(yu)嵌入式設備自動化的“Nvidia Jetson”都是(shi)基于(yu)Tegra系(xi)列芯(xin)片。

自動駕(jia)駛(shi)芯片是智能(neng)駕(jia)駛(shi)平(ping)臺的關鍵要(yao)素,在(zai)英(ying)偉達之(zhi)外,高(gao)通和英(ying)特爾也(ye)對此雄心勃(bo)(bo)勃(bo)(bo)。不過就目前(qian)的形勢(shi)來說,英(ying)偉達仍然(ran)處于明顯領先(xian)的位(wei)置。

英(ying)特爾這邊(bian),在(zai)以(yi)高額溢價支付153億(yi)美元(yuan)(yuan)(yuan)收(shou)購(gou)Mobileye過后,雖(sui)然一舉跨進了(le)汽(qi)車零(ling)部(bu)件(jian)供應商(shang)的第一陣(zhen)營,但在(zai)高端產品(pin)性(xing)能上已(yi)被英(ying)偉達拉開差距。根據(ju)Mobileye向美國證(zheng)監會SEC提交的文件(jian),Mobileye的估值(zhi)已(yi)從去年3月(yue)的500億(yi)美元(yuan)(yuan)(yuan)大幅下(xia)滑至(zhi)160億(yi)美元(yuan)(yuan)(yuan)。而高通這邊(bian),在(zai)以(yi)440億(yi)美元(yuan)(yuan)(yuan)收(shou)購(gou)恩智浦的交易告吹后,主(zhu)要聲量更多集中在(zai)以(yi)驍龍8155為代(dai)表的座艙芯片上面。

05、算法、硬件和彩票

愛(ai)迪生在(zai)1877年造出了(le)世界上第(di)一臺留(liu)聲機(ji),隨后這項發(fa)明(ming)跟黑(hei)膠唱片一起(qi),在(zai)那個年代的(de)音(yin)樂愛(ai)好者群體里擴散(san)開來。但愛(ai)迪生本人對(dui)這個現實感到沮喪和失望,因(yin)為他最初為留(liu)聲機(ji)設計的(de)用途(tu)是記(ji)錄(lu)臨終之(zhi)人的(de)遺言。跟這個設想比起(qi)來,拿留(liu)聲機(ji)聽音(yin)樂這事就有(you)點太low了(le)。

在科(ke)技史上,這種(zhong)(zhong)不按劇(ju)本(ben)走(zou)的發明(ming)其實不少,另(ling)外(wai)一個較為(wei)著名的例子是輝瑞公(gong)司(si)研發的心(xin)血(xue)管(guan)藥物西地那非(fei)。這種(zhong)(zhong)命運(yun)的奇特安(an)排有時(shi)(shi)是一種(zhong)(zhong)捉弄,有時(shi)(shi)則被證(zheng)明(ming)是一種(zhong)(zhong)幸運(yun),就像英(ying)偉達一樣。

當然,這么說并不是要(yao)否定黃仁勛的(de)技術眼光和商業才能,而(er)是強調在個人奮(fen)斗的(de)因素之外,也要(yao)考慮到(dao)歷史的(de)行程。

黃仁勛當(dang)然一直知道在電(dian)子(zi)游戲之外,英偉達(da)的(de)GPU存在更多(duo)的(de)潛力,從一種新的(de)計算范式角度來理(li)解GPU,將會(hui)帶(dai)來大得多(duo)的(de)可能。但根據福布斯2016的(de)一篇文章,他并沒有實際上預料(liao)到(dao)深度學習會(hui)成為GPU的(de)爆發性(xing)應(ying)用。

深度學(xue)習的基礎(chu)性工作早在上個世紀就已(yi)經奠基完畢:反向(xiang)傳播算(suan)法最早在1963年就已(yi)經提出,深度卷積神經網(wang)絡(luo)則是在1979年就存在了。但(dan)在中間這(zhe)幾十年里,這(zhe)些(xie)概念并沒有(you)被發揚光(guang)大,直到我(wo)們有(you)了足夠多的數據和充(chong)分的算(suan)力。

事(shi)實上,Google Brain一位叫做(zuo)薩拉(la)·胡克的研究員把深度學習通(tong)過現代(dai)GPU設備取得的進展稱(cheng)之為(wei)中(zhong)了(le)“硬件(jian)(jian)彩票”。雖然薩拉(la)那篇(pian)論文的核心(xin)觀點是想(xiang)提醒公眾,如今(jin)在(zai)學術(shu)界(jie)和業界(jie)取得成(cheng)功脫穎而出的研究想(xiang)法,很(hen)大可能并不是因為(wei)這(zhe)些(xie)想(xiang)法本身在(zai)解(jie)決(jue)對應問題上優于其(qi)他失敗(bai)的idea,只是因為(wei)這(zhe)類(lei)想(xiang)法更符合現有的硬件(jian)(jian)環境。

她認為深(shen)度學(xue)習在GPU這類(lei)并行計算(suan)設備幫助(zhu)下取(qu)得(de)的(de)成績,或許(xu)就是例子。但從(cong)薩(sa)拉的(de)觀(guan)點中(zhong),我們顯然也可(ke)以反過來窺見一絲GPU最終被(bei)深(shen)度學(xue)習選中(zhong)的(de)偶然性。

今(jin)天我們談起深度(du)學習(xi)的(de)起源和英偉(wei)達的(de)命運拐點時(shi),總(zong)是繞不開的(de)一個標志性事(shi)件,即2012年Hinton及他的(de)博士生Krizhevsky和Sutskever參(can)加ImageNet圖像(xiang)識別大賽時(shi),用(yong)卷積神(shen)經(jing)網絡把錯誤率從上年度(du)的(de)25%一舉(ju)降(jiang)到了15%。而Krizhevsky等人在訓練(lian)神(shen)經(jing)網絡模(mo)型的(de)時(shi)候,使用(yong)了兩張英偉(wei)達的(de)GeForce游戲顯卡(ka)學習(xi)了120萬張圖片。

但Krizhevsky等人并不是第一個使(shi)用(yong)GPU來訓練深度(du)神經網絡(luo)的(de)學者(zhe)。吳(wu)恩達的(de)斯坦福團隊在2008年就(jiu)寫了一篇《Large-scale Deep Unsupervised Learning using Graphics Processors》的(de)論文(wen),里面提到用(yong)GPU可(ke)以(yi)大幅加速(su)神經網絡(luo)模型的(de)學習過程。

然而(er)直到(dao)(dao)2013年的英(ying)偉達GTC大會(hui)上(shang),黃仁勛演講時的keynote里都基本沒有怎(zen)么提AI。要等到(dao)(dao)第二年的GTC,我們才會(hui)看(kan)到(dao)(dao)黃仁勛把人工智能領域看(kan)作英(ying)偉達最(zui)關鍵(jian)的業務。

這(zhe)(zhe)也說明黃仁勛并非一開始就推all in AI,而是在業界已(yi)然形成風氣(qi)后才(cai)做這(zhe)(zhe)件(jian)事。不過(guo)即便(bian)從這(zhe)(zhe)時間節點上來說,英偉達的動作(zuo)也算相(xiang)當早了。

當(dang)然,如之(zhi)前所(suo)說,沒有精(jing)準(zhun)預(yu)見AI會在多(duo)年后成為英偉達的帝(di)國基(ji)座,并不影響(xiang)黃(huang)仁勛(xun)的偉大(da)。

某種程(cheng)度(du)上說,從最初沿著圖像計算這個方(fang)向的創新,到后來(lai)圍繞CUDA建(jian)立的技術生態,英偉達的布局注定將會長(chang)出驚(jing)艷的果(guo)實。黃仁勛(xun)沒有預料(liao)到這個果(guo)實具體(ti)會是什么,但(dan)他知(zhi)道它一定會長(chang)出來(lai)。

最(zui)新(xin)的二季度(du)財報顯(xian)示,英偉(wei)達本季營收達到(dao)了破紀錄的135.1億美(mei)元,同比增長(chang)(chang)101%。其中,最(zui)大貢(gong)獻為(wei)數據中心業(ye)務,當季業(ye)務收入為(wei)103.2億美(mei)元,同比增長(chang)(chang)171%,同創下歷史新(xin)高。即(ji)便在之前(qian)的業(ye)績指引里,已經預(yu)料到(dao)這個季度(du)營收和利潤會(hui)爆(bao),但管理層(ceng)和華爾(er)街(jie)都沒想到(dao)會(hui)爆(bao)的這么厲(li)害。

自2021財(cai)年Q2數(shu)(shu)據中心(xin)(xin)營收(shou)超過游戲業務以來,前(qian)者日益成為英(ying)偉達業績(ji)的(de)壓(ya)艙石。二季度(du)數(shu)(shu)據中心(xin)(xin)業務收(shou)入(ru)占總收(shou)入(ru)的(de)比例從去(qu)年同期(qi)的(de)35%上升到了76%。

如果要提英偉達近幾年唯(wei)一經歷(li)的(de)一個挫敗,大概就是2020年對Arm公司的(de)收購因(yin)監管原因(yin)告吹(chui)。

我們之前在第二部分(fen)里提到過,從芯(xin)片(pian)的分(fen)類來說,英特爾和(he)(he)英偉達(da)分(fen)別(bie)處(chu)于通才(cai)和(he)(he)專才(cai)兩端(duan)。當下數(shu)據中(zhong)心的發展趨勢是(shi)系(xi)統集(ji)成(cheng)程(cheng)度越(yue)來越(yue)高,越(yue)來越(yue)往SoC的方向發展,芯(xin)片(pian)公司需(xu)要整合(he)CPU和(he)(he)GPU,就像蘋果在消(xiao)費者業務里M系(xi)列芯(xin)片(pian)做的那樣。

而隨著數據中心業務對于兩家公司(si)的重要(yao)性不(bu)斷提升,二(er)者都在試圖彌補自身的短板(ban)。

英特爾一直都是做(zuo)CPU的(de),它需要往專(zhuan)才的(de)方(fang)向靠,所以過去幾(ji)年接連收(shou)(shou)購(gou)了Altera、Mobileye、Habana Labs等公司(si);而英偉(wei)達一直都是做(zuo)GPU的(de),所以它需要往通才的(de)方(fang)向靠,這構成了它收(shou)(shou)購(gou)Arm的(de)基本邏輯。另外,從這個角度看,AMD由(you)于在很早(zao)之(zhi)前就收(shou)(shou)購(gou)了ATI,有著多年CPU和GPU兩方(fang)面(mian)的(de)打螺(luo)絲經驗(yan),所以理論上(shang)說它其實有些獨特的(de)優勢。

當然,這樁(zhuang)收購案告吹的最大受害者可能是(shi)孫正義,即便他剛(gang)從Arm上(shang)市中回(hui)了波血。

當時軟銀因終止收購獲得的(de)(de)(de)12.5億(yi)美(mei)元(yuan)分手費(fei),對(dui)于本來(lai)可能獲得的(de)(de)(de)收益來(lai)說顯得不(bu)值(zhi)一提。因為(wei)2020年的(de)(de)(de)時候英(ying)偉達的(de)(de)(de)收購要約是120億(yi)美(mei)元(yuan)現金(jin)(jin),加上215億(yi)美(mei)元(yuan)的(de)(de)(de)英(ying)偉達股*。如果按照最(zui)新市值(zhi)計(ji)算,這筆交(jiao)易的(de)(de)(de)價值(zhi)已經在千(qian)億(yi)美(mei)元(yuan)規(gui)模(mo)。這樣看,孫正(zheng)義(yi)愿景基金(jin)(jin)上個財年虧損的(de)(de)(de)320億(yi)美(mei)元(yuan),或許都有機會找補回(hui)來(lai)。

06、寫在最后

英特爾(er)的創(chuang)始員工(gong)和第三任(ren)CEO安迪·格魯(lu)夫曾說過一句話,“成功引起自(zi)滿,自(zi)滿導致失敗,只有偏執狂才能(neng)生存”。

我們很難說這是(shi)(shi)(shi)否道出了英特爾錯(cuo)失新浪潮的原因,但可以確定的是(shi)(shi)(shi),黃仁勛(xun)的偏執是(shi)(shi)(shi)今天成就(jiu)英偉(wei)達的關鍵。在商業(ye)和技術兩(liang)方面,他都稱得上是(shi)(shi)(shi)天才。

在(zai)目所能及的(de)(de)范圍內,當下的(de)(de)英(ying)偉(wei)達(da)還沒有與之匹敵的(de)(de)對手。但萬億英(ying)偉(wei)達(da)所昭示的(de)(de)簡(jian)單事實是,它正處(chu)在(zai)一(yi)條前途光(guang)明但又令(ling)人趨之若(ruo)鶩的(de)(de)賽道上。谷歌亞馬遜微軟這(zhe)些大廠都在(zai)嘗(chang)試(shi)自(zi)己(ji)設(she)計的(de)(de)AI加速芯片(pian),瞄準自(zi)動駕駛和其(qi)他AI算力的(de)(de)創業公司如雨后(hou)春筍,而(er)已被甩在(zai)身(shen)后(hou)的(de)(de)AMD和英(ying)特爾更有充分的(de)(de)可能卷土重(zhong)來。

黃仁勛仍需帶領(ling)英偉達的(de)同志繼續保持謙虛謹慎、不驕不躁(zao)的(de)作風。

芯片(pian) 顯卡 英偉(wei)達
評論
還可輸入300個字
400-858-9000
免費服務熱線
郵箱
09:00--20:00
服務時間
投訴電話
投融界App下載
官方微信公眾號
官方微信小程序
Copyright ? 2024 浙江投融界科技有限公司(xxccv.cn) 版權所有 | ICP經營許可證:浙B2-20190547 | | 浙公網安備330號
地址:浙江省杭州市西湖區留下街道西溪路740號7號樓301室
浙江投融界科技有限公司xxccv.cn版權所有 | 用戶協議 | 隱私條款 | 用戶權限
應用版本:V2.7.8 | 更新日期:2022-01-21
 
在線客服
微(wei)信(xin)訂(ding)閱