DePIN機(jī)器人技術(shù)正面臨哪些挑戰(zhàn)?擴(kuò)展去中心化機(jī)器人的主要障礙是什么?
引言:2月27日,Messari舉辦了一場(chǎng)關(guān)于“構(gòu)建去中心化物理人工智能”的播客,邀請(qǐng)了FrodoBot Lab的聯(lián)合創(chuàng)始人Michael Cho。他們深入探討了去中心化物理基礎(chǔ)設(shè)施網(wǎng)絡(luò)(DePIN)在機(jī)器人技術(shù)領(lǐng)域的挑戰(zhàn)與機(jī)遇。盡管該領(lǐng)域尚處萌芽階段,但其潛力巨大,有望徹底重塑AI機(jī)器人在現(xiàn)實(shí)世界中的運(yùn)作模式。然而,與依賴海量互聯(lián)網(wǎng)數(shù)據(jù)的傳統(tǒng)AI不同,DePIN機(jī)器人AI技術(shù)面臨更為復(fù)雜的難題,包括數(shù)據(jù)采集、硬件限制、評(píng)估瓶頸以及經(jīng)濟(jì)模式的可持續(xù)性。本文將剖析此次討論的核心要點(diǎn),揭示DePIN機(jī)器人技術(shù)遭遇的困境,解析擴(kuò)展去中心化機(jī)器人的主要障礙,并闡述為何DePIN相較于中心化方法更具優(yōu)勢(shì)。最后,我們將展望DePIN機(jī)器人技術(shù)的未來(lái),探討其是否即將迎來(lái)類似“ChatGPT時(shí)刻”的突破性進(jìn)展。
DePIN智能機(jī)器人的發(fā)展瓶頸
Michael Cho在創(chuàng)立FrodoBot之初,最困擾他的便是機(jī)器人技術(shù)的成本問(wèn)題。當(dāng)時(shí)市面上商用機(jī)器人價(jià)格高得令人咋舌,嚴(yán)重制約了AI在現(xiàn)實(shí)世界中的應(yīng)用推廣。他的最初解決方案是打造一款售價(jià)僅500美元的低成本自主機(jī)器人,意圖以價(jià)格優(yōu)勢(shì)搶占市場(chǎng)。但隨著研發(fā)的深入,Michael意識(shí)到,成本并非真正的瓶頸。DePIN機(jī)器人技術(shù)面臨的挑戰(zhàn)遠(yuǎn)比“貴不貴”更為復(fù)雜。隨著FrodoBotLab的持續(xù)推進(jìn),DePIN機(jī)器人技術(shù)的多個(gè)瓶頸逐漸浮出水面。若要實(shí)現(xiàn)大規(guī)模部署,以下這些瓶頸必須被逐一攻克。
瓶頸一:數(shù)據(jù)采集難題
與依賴海量互聯(lián)網(wǎng)數(shù)據(jù)訓(xùn)練的“線上”AI大模型不同,具身化AI(embodied AI)需要與現(xiàn)實(shí)世界直接互動(dòng)才能發(fā)展出真正的智能。然而,目前全球尚未形成大規(guī)模的基礎(chǔ)設(shè)施來(lái)支持這種數(shù)據(jù)采集,且業(yè)界對(duì)于如何收集這些數(shù)據(jù)仍缺乏共識(shí)。具身化AI的數(shù)據(jù)采集主要分為三大類:
第一類是人類操作數(shù)據(jù),即人類手動(dòng)控制機(jī)器人時(shí)產(chǎn)生的數(shù)據(jù)。這類數(shù)據(jù)質(zhì)量極高,能夠完整捕捉視頻流和動(dòng)作標(biāo)簽——也就是人類觀察到的環(huán)境與相應(yīng)的反應(yīng)。這是訓(xùn)練AI模仿人類行為的最佳方式,但缺點(diǎn)是成本高昂且勞動(dòng)強(qiáng)度大。
第二類是合成數(shù)據(jù)(模擬數(shù)據(jù)),這類數(shù)據(jù)對(duì)于訓(xùn)練機(jī)器人在復(fù)雜地形中移動(dòng)尤為有用,例如訓(xùn)練機(jī)器人在崎嶇地面上行走,對(duì)特定專業(yè)領(lǐng)域具有顯著價(jià)值。然而,對(duì)于變化多端的任務(wù),如烹飪,模擬環(huán)境往往難以覆蓋所有真實(shí)場(chǎng)景。以訓(xùn)練機(jī)器人煎蛋為例:鍋的類型、油溫、房間條件的細(xì)微變化都會(huì)影響結(jié)果,而虛擬環(huán)境很難模擬這些復(fù)雜因素。
第三類是視頻學(xué)習(xí),即讓AI模型通過(guò)觀察現(xiàn)實(shí)世界的視頻來(lái)學(xué)習(xí)。雖然這種方法具有潛力,但它缺乏智能所需的真正物理互動(dòng)反饋,難以實(shí)現(xiàn)深度學(xué)習(xí)。
瓶頸二:自主性水平提升困境
Michael回憶,他首次在現(xiàn)實(shí)世界測(cè)試FrodoBot時(shí),主要應(yīng)用于最后一英里的配送任務(wù)。從數(shù)據(jù)上看,結(jié)果還算理想——機(jī)器人成功完成了90%的配送任務(wù)。但在現(xiàn)實(shí)生活中,10%的失敗率是不可接受的。一個(gè)每十次配送就失敗一次的機(jī)器人,根本無(wú)法商業(yè)化。這與自動(dòng)駕駛技術(shù)類似:無(wú)人駕駛即使擁有萬(wàn)千次成功駕駛記錄,一次失敗也可能徹底摧毀商業(yè)消費(fèi)者的信心。
因此,要讓機(jī)器人技術(shù)真正實(shí)用,成功率必須接近99.99%甚至更高。但問(wèn)題是,每提高0.001%的準(zhǔn)確率,都需要付出指數(shù)級(jí)的時(shí)間和精力。許多人低估了這最后一步的難度。Michael曾于2015年乘坐谷歌的自動(dòng)駕駛汽車(chē)原型,當(dāng)時(shí)他堅(jiān)信完全自動(dòng)駕駛即將實(shí)現(xiàn)。十年過(guò)去,我們?nèi)栽谔接懞螘r(shí)能達(dá)成Level 5的完全自主性。機(jī)器人技術(shù)的進(jìn)步并非線性,而是指數(shù)性質(zhì)的——每前進(jìn)一步,難度都會(huì)大幅增加。這最后的1%準(zhǔn)確率,可能需要數(shù)年甚至數(shù)十年的持續(xù)努力才能實(shí)現(xiàn)。
瓶頸三:硬件限制亟待突破
退一步講,即使AI模型再為先進(jìn),現(xiàn)有的機(jī)器人硬件也尚未準(zhǔn)備好實(shí)現(xiàn)真正的自主性。在硬件方面,最容易被忽視的問(wèn)題是觸覺(jué)傳感器的缺乏——目前最先進(jìn)的技術(shù)(如Meta AI的研究成果)仍遠(yuǎn)遠(yuǎn)達(dá)不到人類指尖的敏感度。人類依靠視覺(jué)和觸覺(jué)與世界互動(dòng),而機(jī)器人對(duì)紋理、抓握和壓力反饋幾乎一無(wú)所知。
此外,遮擋問(wèn)題同樣嚴(yán)峻——當(dāng)物體部分被遮擋時(shí),機(jī)器人很難識(shí)別并與之互動(dòng)。而人類即使看不到物體的全貌,也能憑借直覺(jué)理解它。除了感知問(wèn)題,機(jī)器人執(zhí)行器本身也存在缺陷。大多數(shù)仿人機(jī)器人將執(zhí)行器直接置于關(guān)節(jié)上,導(dǎo)致它們笨重且存在潛在危險(xiǎn)。相比之下,人類的肌腱結(jié)構(gòu)使動(dòng)作更平滑、更安全。這就是為什么現(xiàn)有的仿人機(jī)器人看起來(lái)僵硬且不靈活。像Apptronik這樣的公司正在開(kāi)發(fā)更具生物靈感的執(zhí)行器設(shè)計(jì),但這些創(chuàng)新仍需時(shí)間成熟。
瓶頸四:硬件擴(kuò)展面臨資本挑戰(zhàn)
與僅依賴計(jì)算能力的傳統(tǒng)AI模型不同,智能機(jī)器人技術(shù)的實(shí)現(xiàn)需要在現(xiàn)實(shí)世界中部署物理設(shè)備。這帶來(lái)了巨大的資本挑戰(zhàn)。制造機(jī)器人成本高昂,只有最有錢(qián)的大公司才能負(fù)擔(dān)得起大規(guī)模實(shí)驗(yàn)。即使是最高效的仿人機(jī)器人,目前成本也高達(dá)數(shù)萬(wàn)美元,大規(guī)模普及根本不現(xiàn)實(shí)。
瓶頸五:評(píng)估有效性的難題
這是一個(gè)“隱形”瓶頸。以ChatGPT為例,這類線上AI大模型幾乎可以瞬間測(cè)試其功能——一個(gè)新語(yǔ)言模型被發(fā)布后,全世界的研究人員或普通用戶通常在幾小時(shí)內(nèi)就能對(duì)其性能優(yōu)劣得出結(jié)論。但評(píng)估物理AI則需要現(xiàn)實(shí)世界的部署,這需要時(shí)間。特斯拉的全自動(dòng)駕駛(FSD)軟件就是個(gè)典型例子。如果特斯拉記錄了100萬(wàn)英里且沒(méi)有事故,這是否意味著它真的達(dá)到了Level 5自主性?1000萬(wàn)英里呢?機(jī)器人智能技術(shù)的問(wèn)題是,唯一驗(yàn)證它的方法就是觀察它最終在哪里失敗,也就意味著需要大規(guī)模、長(zhǎng)時(shí)間的實(shí)時(shí)部署。
瓶頸六:人力不可或缺
另一個(gè)被低估的挑戰(zhàn)是,在機(jī)器人AI開(kāi)發(fā)中,人類勞動(dòng)力依然不可或缺。光靠AI是不夠的。機(jī)器人需要人類操作員提供訓(xùn)練數(shù)據(jù);維護(hù)團(tuán)隊(duì)保持機(jī)器人的運(yùn)行;以及必不可少的研究人員/開(kāi)發(fā)人員持續(xù)優(yōu)化AI模型。與可以在云端訓(xùn)練的AI模型不同,機(jī)器人需要持續(xù)的人類干預(yù)——這也是DePIN必須解決的一個(gè)主要挑戰(zhàn)。
未來(lái)展望:機(jī)器人技術(shù)的“ChatGPT時(shí)刻”何時(shí)到來(lái)?
有些人認(rèn)為,機(jī)器人技術(shù)的“ChatGPT時(shí)刻”即將到來(lái)。Michael對(duì)此持謹(jǐn)慎態(tài)度??紤]到硬件、數(shù)據(jù)和評(píng)估的挑戰(zhàn),他認(rèn)為通用機(jī)器人AI距離大規(guī)模采用還很遙遠(yuǎn)。不過(guò),DePIN機(jī)器人技術(shù)的進(jìn)展確實(shí)讓人看到了希望。機(jī)器人技術(shù)的開(kāi)發(fā)應(yīng)該是去中心化的,而不是由少數(shù)大公司控制。一個(gè)去中心化網(wǎng)絡(luò)的規(guī)模和協(xié)調(diào)性能夠分散資本負(fù)擔(dān)。與其依賴一家大公司出錢(qián)造數(shù)千臺(tái)機(jī)器人,不如將可以貢獻(xiàn)的個(gè)人納入到一個(gè)共享網(wǎng)絡(luò)中。
以數(shù)據(jù)收集和評(píng)估為例——不用等一家公司部署有限的機(jī)器人收集數(shù)據(jù),去中心化網(wǎng)絡(luò)可以以更大的規(guī)模并行運(yùn)行、收集數(shù)據(jù)。例如,在最近一次阿布扎比的一場(chǎng)AI與人類機(jī)器人競(jìng)賽中,來(lái)自DeepMind和UT Austin等機(jī)構(gòu)的研究人員將他們的AI模型與人類玩家進(jìn)行了測(cè)試。雖然人依然占上風(fēng),但研究人員對(duì)從現(xiàn)實(shí)世界機(jī)器人互動(dòng)中收集的獨(dú)特?cái)?shù)據(jù)集感到十分振奮。這從側(cè)面證明了對(duì)連接機(jī)器人技術(shù)各個(gè)組成部分的子網(wǎng)的需求。研究界的熱情也表明,即使完全自主性仍然是一個(gè)長(zhǎng)期目標(biāo),DePIN機(jī)器人技術(shù)已經(jīng)從數(shù)據(jù)收集和訓(xùn)練到現(xiàn)實(shí)世界部署和驗(yàn)證方面展示了切實(shí)的價(jià)值。
另一方面,AI驅(qū)動(dòng)的硬件設(shè)計(jì)改進(jìn),如用AI優(yōu)化芯片和材料工程,可能會(huì)大大縮短時(shí)間線。一個(gè)具體的例子是FrodoBot Lab與其他機(jī)構(gòu)合作,確保了兩盒NVIDIA H100 GPU——每盒都包含八個(gè)H100芯片。這為研究人員提供了必要的計(jì)算能力,用來(lái)處理和優(yōu)化從機(jī)器人部署中收集的現(xiàn)實(shí)世界數(shù)據(jù)的AI模型。如果沒(méi)有這樣的計(jì)算資源,即使是最有價(jià)值的數(shù)據(jù)集也無(wú)法充分利用。可見(jiàn)通過(guò)DePIN去中心化計(jì)算基礎(chǔ)設(shè)施的訪問(wèn),機(jī)器人技術(shù)網(wǎng)絡(luò)可以讓全球的研究人員在不被資本密集的GPU所有權(quán)所限制的情況下訓(xùn)練和評(píng)估模型。如果DePIN能成功眾包數(shù)據(jù)和硬件進(jìn)步,機(jī)器人技術(shù)的未來(lái)可能會(huì)比預(yù)期更早到來(lái)。
此外,像Sam這樣的AI代理(一個(gè)帶有meme幣的旅行KOL機(jī)器人)展示了去中心化機(jī)器人技術(shù)網(wǎng)絡(luò)的新盈利模式。Sam自主運(yùn)行,24/7在多個(gè)城市直播,而它的meme幣也在增值。這種模式展示了由DEPIN驅(qū)動(dòng)的智能機(jī)器人如何通過(guò)去中心化所有權(quán)和代幣激勵(lì)來(lái)維持自身財(cái)務(wù)。未來(lái),這些AI代理甚至可以用代幣支付人類操作員的協(xié)助、租用額外的機(jī)器人資產(chǎn),或者競(jìng)標(biāo)現(xiàn)實(shí)世界的任務(wù),從而形成一個(gè)既有利于AI開(kāi)發(fā)又有利于DePIN參與者的經(jīng)濟(jì)循環(huán)。
總結(jié)
機(jī)器人AI的發(fā)展不僅取決于算法,還涉及硬件升級(jí)、數(shù)據(jù)積累、資金支持以及人的參與。過(guò)去,機(jī)器人行業(yè)的發(fā)展受限于高昂的成本和大型企業(yè)的主導(dǎo)地位,使得創(chuàng)新速度受阻。而DePIN機(jī)器人網(wǎng)絡(luò)的建立意味著,借助去中心化網(wǎng)絡(luò)的力量,機(jī)器人數(shù)據(jù)收集、計(jì)算資源和資本投入可以在全球范圍內(nèi)協(xié)同進(jìn)行,不僅加速AI訓(xùn)練和硬件優(yōu)化,還能降低開(kāi)發(fā)門(mén)檻,讓更多研究人員、創(chuàng)業(yè)者和個(gè)人用戶參與進(jìn)來(lái)。我們也期待,機(jī)器人行業(yè)不再依賴少數(shù)科技巨頭,而是由全球社區(qū)共同推動(dòng),邁向真正開(kāi)放、可持續(xù)的技術(shù)生態(tài)。
本文網(wǎng)址:http://iy168.cn/news/1743.html