48155 人形機器人,怎么又行了?

2018高清国产一区二区三区-国产黄色视频免费在线观看-欧美激情欧美精品一区二区-免费国产一级片内射老妇

服務熱線:400-858-9000 咨詢/投訴熱線:
國內專業的一站式創業服務平臺
人形機器人,怎么又行了?
鋅產業 ·

山竹

2023/07/14
我們現在已經清晰地看到了一條路,一條在三年、五年內有可能跑出通用人形機器人平臺,甚至在某些特定場景中跑出人形機器人產品的路。
本文來自于微信公眾號“鋅產業”(ID:xinchanye2021),作者:山竹,投融界經授權發布。

在(zai)剛剛過去的WAIC2023上,沒到(dao)(dao)現場的馬斯克,把“擎天柱(zhu)”派到(dao)(dao)了現場……

盡(jin)管這(zhe)臺人(ren)(ren)形機(ji)器人(ren)(ren)被放在了罩子,在現(xian)場(chang)也沒有(you)做(zuo)什么表演或動(dong)作展(zhan)示,但在會場(chang)中依(yi)然被幾(ji)度圍觀。

再(zai)結合馬斯克(ke)在(zai)開幕式視頻(pin)演講(jiang)中發表了的(de)觀點:

“在(zai)將來某個時刻,地球上機器(qi)人與人類(lei)的(de)(de)比(bi)例(li)可能會超過1:1,這意味著機器(qi)人的(de)(de)數量將超過人類(lei),甚至會多很多。”

人(ren)(ren)形機器人(ren)(ren)無疑成了WAIC2023上關(guan)注度最高的一個話(hua)題。

人形機器人,怎么又行了?

實際上(shang),我們發現,WAIC2023上(shang),僅僅是(shi)關(guan)于人形(xing)機(ji)器人的主題論壇就有不下(xia)五(wu)個,參(can)展機(ji)器人廠商(shang)更是(shi)超過了(le)20家(jia)。

此外,據鋅產(chan)業(ye)了解,現(xian)在國內但凡機(ji)器(qi)人(ren)做得還不錯的團隊,不少都已經開始涉(she)足人(ren)形機(ji)器(qi)人(ren)領域(yu)。

除(chu)了康復機(ji)器人(ren)(ren)領(ling)域獨角獸(shou)企業(ye)傅利葉智能在(zai)WAIC2023期間首發(fa)人(ren)(ren)形(xing)機(ji)器人(ren)(ren)外,今年下半年我們(men)將會看到有更多(duo)人(ren)(ren)形(xing)機(ji)器人(ren)(ren)面世。

似(si)乎,一(yi)夜之間(jian),人(ren)(ren)形(xing)機器(qi)人(ren)(ren)猶如雨后春(chun)筍般(ban),從各地相繼(ji)冒(mao)出。

為(wei)什(shen)么圈內人都(dou)覺(jue)得,人形(xing)機器人真得又行了(le)呢?

01

暴力美學造就通用(yong)AI

大家之(zhi)所(suo)以會覺得人形(xing)機(ji)器人又行了,同樣和現在科(ke)技(ji)圈(quan)最火爆(bao)的大模型不(bu)無關系(xi)。

2022年11月30日,ChatGPT正式問(wen)世,隨后,ChatGPT僅僅用了(le)兩個月,就擁有了(le)1億用戶。

一(yi)個對比數據(ju)是(shi)(shi),增長到1億用戶量,Facebook用了(le)4.5年,Instagram用了(le)2.5年,即便是(shi)(shi)如今仍屬(shu)新鮮(xian)事物的TikTok也用了(le)9個月。

之所以列出這(zhe)么一(yi)組數據,是(shi)為(wei)了更(geng)直觀地體現ChatGPT當時(shi)在(zai)全(quan)(quan)球(qiu)(qiu)的火爆程度,而一(yi)般(ban)這(zhe)樣全(quan)(quan)球(qiu)(qiu)性(xing)(xing)的現象級產品,必有其顛(dian)覆性(xing)(xing)所在(zai)。

ChatGPT的(de)(de)顛覆(fu)性在于它的(de)(de)“通(tong)用(yong)性”,準確地(di)說,應(ying)該是人工智(zhi)能的(de)(de)通(tong)用(yong)性。

ChatGPT的(de)(de)背后,是一(yi)家曾經少有人(ren)知(zhi)(至少在國(guo)內是),如今卻無人(ren)不知(zhi)的(de)(de)AI創(chuang)(chuang)業團隊OpenAI,這(zhe)個創(chuang)(chuang)業團隊最早是由特(te)(te)斯(si)拉創(chuang)(chuang)始(shi)人(ren)馬(ma)斯(si)克(ke)、PayPal創(chuang)(chuang)始(shi)人(ren)彼得·蒂爾(er)、YC創(chuang)(chuang)始(shi)人(ren)利文斯(si)頓,以及(ji)現在OpenAI的(de)(de)掌(zhang)舵人(ren)奧(ao)特(te)(te)曼(man)等硅谷大佬創(chuang)(chuang)辦,目的(de)(de)就是為(wei)了研究人(ren)工智能技術。

當然,據馬(ma)斯克曾經透露,創(chuang)立OpenAI其實還(huan)有(you)另一個原因,是幾(ji)位大佬為(wei)了(le)聯(lian)合對抗谷(gu)歌(ge)的AI霸權。

人形機器人,怎么又行了?

這(zhe)樣的(de)硅谷(gu)最(zui)強天團(tuan),既(ji)不缺錢(qian),也(ye)不缺資源,于(yu)是他們走了一(yi)條別(bie)人敢想不敢干的(de)路——用(yong)巨量算力資源訓練一(yi)個(ge)巨量參數的(de)通用(yong)人工(gong)智能大(da)模型,也(ye)就是LLM,通用(yong)大(da)語言模型。

這里我們(men)再列舉兩個數據來看一下(xia),LLM訓(xun)練(lian)究竟有(you)多消耗資源(yuan):

GPT-3使用1萬塊V100GPU,花了(le)30天(tian)才訓(xun)練(lian)(lian)完(wan)了(le)1750億參數(shu),訓(xun)練(lian)(lian)一次要消(xiao)耗19萬度電,整體訓(xun)練(lian)(lian)成本(ben)約為140萬美(mei)元;

GPT-4參數規(gui)模更(geng)是(shi)達到了1.76萬億(yi)個(ge),理(li)論上來(lai)說,消耗資源量至少是(shi)GPT-3的10倍。

我們完全有理由認為,這是一群(qun)科(ke)學瘋子,在通過巨量資(zi)源嘗(chang)試引發一次AI質(zhi)變,他們信奉(feng)的是暴力美學。

幸運(yun)的(de)是,他們成(cheng)功地訓練出了通用(yong)大語言模型,這從ChatGPT問世后的(de)使(shi)用(yong)效果和科技巨頭的(de)追捧熱度就能有一個(ge)直(zhi)觀感受。

人形機器人,怎么又行了?

那么,通用大語言模型,能為人形機器人帶來什(shen)么呢(ni)?

02

人(ren)形機器人(ren)的死(si)亡陷阱

人(ren)形機(ji)器人(ren)一(yi)直(zhi)被認為(wei)是機(ji)器人(ren)的終極形態。

之所(suo)(suo)以(yi)如此,是因為,人形機器人理論上可以(yi)完成所(suo)(suo)有人類在做的非(fei)標(biao)任務。

因而,幾乎(hu)每個機器人(ren)(ren)創業團(tuan)隊,或多或少(shao)都(dou)有過(guo)搞人(ren)(ren)形機器人(ren)(ren)的念頭。

在(zai)之前很長(chang)一段時間(jian)里,大概是早稻田大學搞出WABOT后(hou),人形機器人一直處于一個在(zai)硬件能(neng)力上尋求(qiu)突破的階段。當時大家(jia)都是在(zai)想(xiang),如何通(tong)過工(gong)程結(jie)構、制造能(neng)力、系統動(dong)力學來讓(rang)人形機器人像人一樣地動(dong)起(qi)來。

于是,在過去幾(ji)十年里,隨著(zhu)機器(qi)人(ren)的(de)電機、控制器(qi)、減速器(qi)等核心器(qi)件的(de)工藝、性能(neng)不斷提升,以及機器(qi)人(ren)系統(tong)能(neng)力逐漸完善,人(ren)形(xing)機器(qi)人(ren)最終(zhong)如愿(yuan)逐漸能(neng)夠走了起(qi)來。

我們看到(dao),本(ben)田在1972年(nian)搞(gao)出了阿(a)西莫(ASIMO)震(zhen)驚行業,波士頓動力在2016年(nian)亮出了Atlas秀翻全網。

就(jiu)在(zai)波士頓動力(li)Atlas在(zai)網上又是表演后空翻(fan),又是表演踩梅花樁時,一個一直未能解決的問題(ti)——商業化(hua)問題(ti),讓波士頓動力(li)始終困于熒幕(mu)之上、網絡(luo)之中。

我(wo)們看到,無(wu)法很好地實(shi)現商(shang)業化的(de)波士頓動力,在最近十(shi)年里(li)相繼被最喜歡工(gong)程(cheng)師的(de)谷歌、最喜歡機器人(ren)的(de)軟(ruan)銀先后收(shou)購(gou)后,最終(zhong)又轉手給(gei)了現代(dai)汽(qi)車(che)。

汽車工(gong)業(ye)是自(zi)動化(hua)、信(xin)息化(hua)最高一個場景,也被認為是軍工(gong)之外最有可能率先(xian)用上波(bo)士頓動力四足機器人,甚(shen)至人形(xing)機器人的(de)地方。

2021年6月(yue),波士頓動力正式歸于(yu)現代汽車門下,而這(zhe)很有可能將是(shi)他們最后一(yi)站,如(ru)果這(zhe)一(yi)站商業化(hua)再(zai)沒什么成果,人(ren)形機器人(ren)很有可能會再(zai)次(ci)掉(diao)入死亡曲線(xian)中的又一(yi)個(ge)低谷,沉寂再(zai)所難免。

可能有人(ren)會問,為什么人(ren)形機器人(ren)這么難商業化(hua)?

這(zhe)是因(yin)為人(ren)(ren)形機器(qi)人(ren)(ren)是完(wan)全仿照(zhao)人(ren)(ren)的外形研發的一種機器(qi)人(ren)(ren),因(yin)而(er)天然需要面對更復雜(za)的、不確定的場景。

這有點類似人工智(zhi)能(neng)技術的(de)發展,會下(xia)棋的(de)AlphaGo只能(neng)算是專(zhuan)用人工智(zhi)能(neng),這種(zhong)專(zhuan)用人工智(zhi)能(neng)算法研發只需要瞄(miao)著一個(ge)應用場景,用大量(liang)數(shu)據一直進行訓練,總有修(xiu)成神功的(de)一天(tian)。

對應(ying)到機器(qi)人領(ling)域,面向各類工業環境研發的(de)專(zhuan)用(yong)機械臂已(yi)經(jing)十分成熟,尤其在汽車工業的(de)沖壓(ya)、焊接、噴涂、總裝等環節中早已(yi)有(you)了廣泛應(ying)用(yong),這也就是為什么工業機器(qi)人在全(quan)球能有(you)超過1400億產(chan)值規模(mo)的(de)主要原因。

人形機器(qi)(qi)人要解(jie)決(jue)的(de)(de)(de)不(bu)是(shi)這(zhe)些(xie)問題(ti)(ti)(ti),或者說人們期望作(zuo)為(wei)機器(qi)(qi)人終極形態(tai)的(de)(de)(de)人形機器(qi)(qi)人要解(jie)決(jue)的(de)(de)(de),不(bu)是(shi)這(zhe)類問題(ti)(ti)(ti),而(er)是(shi)真(zhen)實世界中(zhong)更復(fu)雜(za)的(de)(de)(de)問題(ti)(ti)(ti),這(zhe)就需(xu)要解(jie)決(jue)機器(qi)(qi)人的(de)(de)(de)通(tong)用性問題(ti)(ti)(ti)。

我們這里先(xian)說(shuo)一下人工(gong)智能(neng)的本質,我的簡單(dan)理解(jie)是:

人工智能的(de)本質就是(shi)算法(fa)。

算法應用到(dao)軟件上,就形(xing)成了有(you)智能(neng)推薦系(xi)統(tong)(tong)的搜索引擎(qing)、有(you)智能(neng)客服(fu)系(xi)統(tong)(tong)的電(dian)商平臺;

算法應用到硬件(jian)上,就形成(cheng)了有智能語音(yin)(yin)系統(tong)的(de)音(yin)(yin)箱、有智能規(gui)劃系統(tong)的(de)掃(sao)地(di)機(ji)器(qi)人。

所(suo)以,當(dang)通用大語言模型這樣(yang)的通用人(ren)工智能算(suan)法出現后(hou),苦苦尋找(zhao)提升人(ren)形機器(qi)人(ren)通用性的機器(qi)人(ren)團隊,就興奮(fen)了起來。

人(ren)形機(ji)器人(ren)+通用(yong)大語(yu)言(yan)模型,不就(jiu)有了通用(yong)人(ren)形機(ji)器人(ren)了嗎?

03

具(ju)身智能,一次機器人的能力泛(fan)化

在(zai)討論(lun)具身智能(neng)之前,我們先(xian)要(yao)做(zuo)一個假設:

假(jia)設(she)人(ren)(ren)(ren)形機(ji)器(qi)(qi)人(ren)(ren)(ren)所(suo)需(xu)要的(de)電機(ji)的(de)扭矩密度、電池的(de)能(neng)量密度都已經足以支撐(cheng)人(ren)(ren)(ren)形機(ji)器(qi)(qi)人(ren)(ren)(ren)進(jin)行各種高強度運動,控制器(qi)(qi)、減(jian)速器(qi)(qi)也都已經不是問題。

這時(shi)候,軟實力就(jiu)變(bian)得尤(you)為重要,而以ChatGPT為代表(biao)的通用大語言(yan)模(mo)型,顯然已經為人(ren)形機器人(ren)打了一(yi)個樣兒(er)。

ChatGPT當然可以直(zhi)接應用(yong)到(dao)人(ren)形機(ji)器(qi)人(ren)上(shang),這(zhe)就(jiu)能讓人(ren)形機(ji)器(qi)人(ren)在對(dui)我們這(zhe)個真實世界的(de)認知上(shang),有一(yi)個極大的(de)提升,人(ren)機(ji)交(jiao)互能力也會有一(yi)個階躍式(shi)提升。

這(zhe)也是為什(shen)么今年(nian)上半年(nian),阿里、百度(du)分別將(jiang)通用大語言模型首先加載到(dao)了旗下天貓精靈、小度(du)智能音箱上,這(zhe)也或(huo)將(jiang)是我們真正走出弱人工(gong)智能的第一步(bu)。

不過,人(ren)形機(ji)器(qi)人(ren),目前當(dang)務之急,還是將運(yun)(yun)動能(neng)力提上去,如果以人(ren)類運(yun)(yun)動能(neng)力為標準的話,至少要讓(rang)人(ren)形機(ji)器(qi)人(ren)能(neng)先達到及(ji)格線以上。

是的(de)(de),現在(zai)市面上大家能看到的(de)(de)人形(xing)機器人,即便是最基(ji)本(ben)的(de)(de)運動(dong)能力,仍處在(zai)及格(ge)線以下(不是說人形(xing)機器人的(de)(de)運動(dong)能力差,實在(zai)是人類運動(dong)能力太強(qiang)了(le)),這(zhe)是當(dang)下行業的(de)(de)一個普遍共識(shi)。

而(er)據鋅產業了解,現在(zai)已(yi)經有機器人(ren)公司在(zai)通過ChatGPT提升人(ren)形(xing)機器人(ren)運動(dong)能力,例(li)如優必選(xuan)就已(yi)經在(zai)用類ChatGPT大模型做(zuo)運動(dong)規劃(hua),通過大模型做(zuo)長序列(lie)、長周期的動(dong)作序列(lie)拆解。

通過大模型做人形機器人的運動規(gui)劃的好處(chu)是,可以提升機器人在動作執行(xing)過程中(zhong)的決(jue)策和規(gui)劃能力。

這其(qi)中體現大模型通用性的(de),是一個被稱作“泛化”的(de)能力(li)。

我(wo)是在清(qing)華大學交叉(cha)信(xin)息研究院助理教授許華哲的演講中(zhong)了解的這個概念,他(ta)用機器人切豆腐為例解釋了泛(fan)化能力(li)對(dui)于具身智能的重要性:

一臺機器人(ren)學會用一把刀(dao)切(qie)豆腐(fu)后(hou),當這(zhe)(zhe)(zhe)把刀(dao)的顏色(se)、姿態(tai)、位置無論怎樣變化(hua),這(zhe)(zhe)(zhe)臺機器人(ren)都能識別出這(zhe)(zhe)(zhe)把刀(dao),并(bing)完成切(qie)豆腐(fu)這(zhe)(zhe)(zhe)個任務,這(zhe)(zhe)(zhe)就是泛化(hua)能力的體現。

如果人(ren)(ren)形機器人(ren)(ren)在運動規劃上也有了這樣的泛化能力,那(nei)么,理論上,人(ren)(ren)形機器人(ren)(ren)只(zhi)要(yao)學會在一種地形上走(zou)路,就能夠(gou)自己學會在全地形場景下(xia)自由(you)行走(zou)。

也就是說,走路就成(cheng)了人(ren)形(xing)機器(qi)人(ren)的(de)一個目(mu)標(biao)(biao),人(ren)形(xing)機器(qi)人(ren)只要(yao)在(zai)一個環境下實現了這(zhe)個目(mu)標(biao)(biao),就能夠在(zai)所有環境中(zhong)自適(shi)應完成(cheng)目(mu)標(biao)(biao)。

這時,機器人(ren)就從程序(xu)執(zhi)行導向(xiang),轉向(xiang)為目標(biao)完成(cheng)導向(xiang)。

這樣的人形(xing)機器人也就有了感知運動(dong)智能,甚至有了一定的認知能力,人形(xing)機器人由此(ci)也就完成(cheng)了一次(ci)高維進化。

具(ju)備泛(fan)化能力,正是(shi)人形機器(qi)人成為通用機器(qi)人的第一(yi)步。

04

人形機器(qi)人的N種可(ke)能

首(shou)先(xian)說一個我自(zi)己的判(pan)斷:

無論是否有被冠以“通用(yong)”二字,人形機器人本質上就是一類(lei)擁(yong)有通用(yong)能(neng)力(li)的(de)機器人。

如果不是為了做(zuo)通(tong)用機器人,完全沒有必要做(zuo)成人形。

在(zai)自動化能力更高(gao)(gao)(gao)的(de)倉(cang)儲(chu)系統中,AGV效率本(ben)就更高(gao)(gao)(gao);在(zai)汽車(che)總裝(zhuang)車(che)間里,機(ji)械臂效率也已經很高(gao)(gao)(gao)。

如果追求極致高效,應用于這些場景中(zhong)的機器人完全沒(mei)有必要做成人形。

所以,這幾(ji)年陸(lu)續出現的人(ren)形機(ji)器(qi)人(ren),某種意義上,都可(ke)以被認為是(shi)通用(yong)人(ren)形機(ji)器(qi)人(ren)。

但人形機(ji)器人在實際應用時,會率先在哪(na)些(xie)場景(jing)落地?

我們現在能夠看到的(de)(de)是(shi),特(te)斯拉(la)正在嘗試將(jiang)人(ren)形(xing)機(ji)(ji)(ji)器人(ren)應(ying)用(yong)于工(gong)廠中,前不久發布了人(ren)形(xing)機(ji)(ji)(ji)器人(ren)的(de)(de)傅利葉智能本就是(shi)醫療康養機(ji)(ji)(ji)器人(ren)領(ling)域的(de)(de)明星企(qi)業,養老(lao)、助老(lao)也(ye)就成了人(ren)形(xing)機(ji)(ji)(ji)器人(ren)落地場景(jing)之一。

顯然,制造(zao)工廠、醫(yi)療康養,已經成了如(ru)今(jin)人形機器人兩個黃金賽道。

如果再(zai)往長(chang)遠來看(kan),就像大模型在各個行(xing)業(ye)中都(dou)已經裂變出(chu)了(le)行(xing)業(ye)大模型一(yi)樣,搭(da)載行(xing)業(ye)大模型的人(ren)形(xing)機器人(ren),也會隨(sui)之進入各個行(xing)業(ye)。

不過,這(zhe)其中還有兩個關(guan)鍵難題需要解決(jue):

一個是硬件(jian)難題,關鍵零部件(jian)的(de)技術(shu)突破,將(jiang)成為擁有優秀(xiu)的(de)運動(dong)能(neng)力(li)的(de)平臺級(ji)人(ren)(ren)形機器(qi)人(ren)(ren)成形的(de)關鍵;

我們看到,國內(nei)越(yue)來越(yue)多硬(ying)科(ke)技團隊涌入人(ren)形(xing)機器(qi)人(ren)這一(yi)賽(sai)道(dao)中,但是(shi)人(ren)形(xing)機器(qi)人(ren)的關鍵零部(bu)件仍需進(jin)一(yi)步(bu)突破,才能(neng)支(zhi)撐起一(yi)個通用人(ren)形(xing)機器(qi)人(ren)平臺(tai)的成(cheng)形(xing)。

以電機為例,目前,電機扭矩密度(du)做得最高的是MIT和UCLA做的電機,已經能實現38N.m/kg的扭矩密度(du),但這尚不足以支撐一(yi)臺標(biao)準(zhun)體(ti)重的成年男人自由(you)彈跳或(huo)奔跑。

一(yi)個(ge)是軟件難題,人形(xing)(xing)機(ji)器人現(xian)在還沒有足(zu)夠的場景數據,來在某個(ge)場景中訓練出一(yi)個(ge)通(tong)用(yong)人工智能(neng)大模型,讓人形(xing)(xing)機(ji)器人基于此進行自(zi)我進化(hua)。

前文提到,以ChatGPT為代表的(de)(de)通(tong)用(yong)人(ren)工智能(neng)本身(shen)追求的(de)(de)是暴力(li)美(mei)學,需要(yao)大量(liang)樣本數據來(lai)訓練(lian),才能(neng)形成具備(bei)通(tong)用(yong)知識的(de)(de)理解(jie)、分析、決策能(neng)力(li)的(de)(de)通(tong)用(yong)人(ren)工智能(neng)大模型(xing)。

對于人(ren)形(xing)機(ji)器人(ren)而言(yan),由于尚且沒(mei)有得到批量化應用的(de)場景,也就沒(mei)有這(zhe)么多直接的(de)場景數據。

例如在工(gong)業場景(jing)中,由于(yu)此前并(bing)沒有人(ren)形機(ji)器(qi)人(ren)直(zhi)接參與,相應的(de)運(yun)行(xing)數據自然也就無從談(tan)起,可以用(yong)于(yu)人(ren)形機(ji)器(qi)人(ren)訓練的(de)場景(jing)數據,更多是來自空(kong)間位(wei)置數據、機(ji)械(xie)臂及制造設備的(de)運(yun)行(xing)數據,以及工(gong)人(ren)的(de)工(gong)作日志等。

不過,清華大(da)學(xue)鄧(deng)志東教授也(ye)指出,大(da)模型+思維鏈(lian)等提示詞工程,可以實現零樣本(ben)學(xue)習,這將(jiang)推動智能機器(qi)人的產業落地。

總體(ti)而言(yan),人形機器人發展道路上(shang)依然(ran)有諸多困難。

不(bu)同的是,我(wo)們現在已(yi)經(jing)清晰地看到了一(yi)條路,一(yi)條在三年(nian)、五年(nian)內(nei)有可能跑(pao)出通用人形機器人平臺,甚至(zhi)在某(mou)些(xie)特定場(chang)景中跑(pao)出人形機器人產品的路。

就在五年前,整個(ge)行業的判(pan)斷還是要十年、二十年,乃至更(geng)長時間(jian)才(cai)能(neng)到來。

這(zhe)就是當(dang)下(xia)這(zhe)個(ge)時(shi)代(dai),一個(ge)讓機(ji)器(qi)人團隊再次興奮起來的(de)時(shi)代(dai)。

AI 人形機器(qi)人
評論
還可輸入300個字
400-858-9000
免費服務熱線
郵箱
09:00--20:00
服務時間
投訴電話
投融界App下載
官方微信公眾號
官方微信小程序
Copyright ? 2024 浙江投融界科技有限公司(xxccv.cn) 版權所有 | ICP經營許可證:浙B2-20190547 | | 浙公網安備330號
地址:浙江省杭州市西湖區留下街道西溪路740號7號樓301室
浙江投融界科技有限公司xxccv.cn版權所有 | 用戶協議 | 隱私條款 | 用戶權限
應用版本:V2.7.8 | 更新日期:2022-01-21
 
在線客服
微(wei)信訂閱