實(shí)現(xiàn)真正 DeFai 愿景的道路充滿挑戰(zhàn),需要攻克單體 AI 模型能力上限、多模態(tài)交互協(xié)作的原子性保障、多模態(tài)系統(tǒng)資源調(diào)度與支配、系統(tǒng)容錯(cuò)與故障處理機(jī)制等一系列復(fù)雜難題。
一夜之間,許多朋友紛紛向我推薦 #manus,稱其為全球首款真正通用的 AI Agent,能夠獨(dú)立思考并規(guī)劃執(zhí)行復(fù)雜任務(wù),最終交付完整成果。這一概念聽(tīng)起來(lái)令人興奮,但除了引發(fā)朋友圈中關(guān)于失業(yè)焦慮的討論外,manus 究竟能為 web3 DeFai 場(chǎng)景帶來(lái)怎樣的變革?以下,我將分享我的思考。
一個(gè)月前,OpenAI 推出了同類產(chǎn)品 Operator,AI 可在瀏覽器中獨(dú)立完成餐廳預(yù)訂、購(gòu)物、訂票、外賣訂餐等任務(wù),用戶可實(shí)時(shí)可視化監(jiān)督,并隨時(shí)接管控制權(quán)。然而,這套 Agent 并未引起廣泛討論,原因在于其單一模型驅(qū)動(dòng)的工具調(diào)用框架,用戶若意識(shí)到關(guān)鍵決策仍需人工干預(yù),便失去了依賴其執(zhí)行任務(wù)的意愿。
manus 表面看似與 Operator 類似,只是應(yīng)用場(chǎng)景更為豐富,涵蓋簡(jiǎn)歷篩選、股票研究、房產(chǎn)購(gòu)買等,但背后框架與執(zhí)行系統(tǒng)的差異卻十分顯著。Manus 由多模態(tài)大模型驅(qū)動(dòng),并創(chuàng)新性地采用了多重簽名系統(tǒng)。簡(jiǎn)而言之,AI 模仿人類執(zhí)行(計(jì)劃-執(zhí)行-檢查-行動(dòng))的 PDCA 循環(huán),將由多個(gè)大模型協(xié)同完成,每個(gè)模型專注特定環(huán)節(jié),既能降低決策風(fēng)險(xiǎn),又能提升執(zhí)行效率。所謂「多重簽名系統(tǒng)」,實(shí)則是一種多模型協(xié)作的決策驗(yàn)證機(jī)制,通過(guò)要求多個(gè)專業(yè)模型的共同確認(rèn)來(lái)確保決策與執(zhí)行的可靠性。
通過(guò)對(duì)比,manus 的優(yōu)勢(shì)逐漸顯現(xiàn),視頻 Demo 中展示的操作體驗(yàn)更讓人印象深刻。但客觀而言,manus 對(duì) Operator 的迭代創(chuàng)新尚屬起步階段,尚未達(dá)到顛覆性革命的程度。關(guān)鍵在于執(zhí)行任務(wù)的復(fù)雜度,以及非統(tǒng)一標(biāo)準(zhǔn)用戶 input Prompt 進(jìn)入后大模型的容錯(cuò)率與交付結(jié)果成功率。若順著這一創(chuàng)新思路,web3 的 DeFai 場(chǎng)景是否就能迅速成熟應(yīng)用?顯然,現(xiàn)實(shí)并非如此。
例如,在 DeFai 場(chǎng)景下,Agent 執(zhí)行交易決策時(shí),需要一個(gè) Oracle 層 Agent 負(fù)責(zé)鏈上數(shù)據(jù)收集與驗(yàn)證,整合分析數(shù)據(jù),并實(shí)時(shí)監(jiān)控鏈上價(jià)格以捕捉交易機(jī)會(huì)。這一過(guò)程對(duì)實(shí)時(shí)分析能力要求極高,可能存在一秒前還有效的交易機(jī)會(huì),但等到 Oracle 大模型傳輸給交易執(zhí)行 Agent 時(shí),機(jī)會(huì)已消失(套利窗口)。這暴露了多模態(tài)大模型在執(zhí)行決策時(shí)的最大軟肋:如何聯(lián)網(wǎng)、觸鏈調(diào)取 Real-Time 級(jí)別的數(shù)據(jù),并從中分析出交易機(jī)會(huì),進(jìn)而完成捕捉。聯(lián)網(wǎng)環(huán)境尚可,許多電商網(wǎng)站訂單價(jià)格并非實(shí)時(shí)變動(dòng),不易引發(fā)系統(tǒng)動(dòng)態(tài)平衡問(wèn)題,但在鏈上,這一挑戰(zhàn)卻無(wú)處不在。
因此,整體而言,manus 的出現(xiàn)確實(shí)會(huì)在 web2 領(lǐng)域引發(fā)一波朋友圈焦慮,畢竟許多重復(fù)性高的文職和信息處理工種可能面臨被 AI 取代的風(fēng)險(xiǎn)。但讓他們焦慮的是另一回事。在 web3 對(duì) DeFai 應(yīng)用場(chǎng)景的推動(dòng)作用上,我們需客觀認(rèn)識(shí):
必須承認(rèn),其意義確實(shí)重大。畢竟,manus 提出的 LLM OS 以及 Less Structure more intelligence 理念,尤其是多重簽名系統(tǒng),將為 web3 拓展 DeFi 與 AI 的結(jié)合提供諸多啟示。這糾正了大部分 DeFai 項(xiàng)目的重大誤區(qū)——不要試圖依靠單一大模型實(shí)現(xiàn) AI Agent 的自主思考與決策等復(fù)雜目標(biāo),這在金融場(chǎng)景下根本不切實(shí)際。
真正 DeFai 愿景的實(shí)現(xiàn),需要解決單體 AI 模型能力上限、多模態(tài)交互協(xié)作的原子性保障、多模態(tài)系統(tǒng)資源調(diào)度與支配、系統(tǒng)容錯(cuò)與故障處理機(jī)制等一系列復(fù)雜問(wèn)題。例如:
– **Oracle 層 Agent**:負(fù)責(zé)收集鏈上數(shù)據(jù)與分析,監(jiān)控價(jià)格,形成有效數(shù)據(jù)源;
– **決策層 Agent**:根據(jù) Oracle 提供的數(shù)據(jù)進(jìn)行分析與風(fēng)險(xiǎn)評(píng)估,制定決策與行動(dòng)方案;
– **執(zhí)行層 Agent**:根據(jù)決策層給出的多種方案,結(jié)合實(shí)際情況執(zhí)行,包括 gas 費(fèi)用優(yōu)化、跨鏈狀態(tài)、交易排序沖突等。
唯有這一系列 Agent 都足夠強(qiáng)大,并有一個(gè)龐大的系統(tǒng)框架落定,真正的 DeFai 革命才會(huì)到來(lái)。
本文網(wǎng)址:http://iy168.cn/news/545.html