隨著人工智能技術(shù)的飛速發(fā)展,如何科學(xué)評(píng)估模型性能并建立用戶信任已成為行業(yè)核心挑戰(zhàn)。傳統(tǒng)評(píng)估體系存在明顯短板:集中化機(jī)制難以覆蓋多元場(chǎng)景,無(wú)法真實(shí)反映用戶偏好,而模型”幻覺”現(xiàn)象頻發(fā)更讓用戶陷入選擇困境。在這一關(guān)鍵節(jié)點(diǎn),Yupp 平臺(tái)應(yīng)運(yùn)而生,憑借創(chuàng)新的區(qū)塊鏈技術(shù)與激勵(lì)機(jī)制,正在重新定義 AI 模型的發(fā)現(xiàn)、比較和使用方式,為 AI 評(píng)估領(lǐng)域帶來(lái)革命性變革。
Yupp 團(tuán)隊(duì)由資深技術(shù)專家領(lǐng)導(dǎo),創(chuàng)始人 Pankaj Gupta 和 Gilad Mishne 擁有 Twitter、Google 和 Coinbase 的豐富經(jīng)驗(yàn),首席科學(xué)家 Jimmy Lin(滑鐵盧大學(xué)教授)更參與核心研發(fā)。三人自 2010 年起共事,在推薦系統(tǒng)與搜索技術(shù)領(lǐng)域取得突破性成果。他們創(chuàng)立 Yupp 的初衷是構(gòu)建一個(gè)”去信任”的 AI 反饋市場(chǎng),通過(guò)區(qū)塊鏈和加密經(jīng)濟(jì)機(jī)制實(shí)現(xiàn)用戶反饋的透明流通,形成可擴(kuò)展、公平的模型評(píng)估體系。這種創(chuàng)新理念迅速獲得行業(yè)認(rèn)可,在 A16z 領(lǐng)投的 3300 萬(wàn)美元種子輪融資中,吸引了 Google 首席科學(xué)家 Jeff Dean、Twitter 聯(lián)合創(chuàng)始人 Biz Stone 等知名投資人參與。
Yupp 的核心功能設(shè)計(jì)極具創(chuàng)新性。平臺(tái)秉持”人人共享 AI”理念,讓用戶能夠輕松發(fā)現(xiàn)、比較和使用最新 AI 模型。其獨(dú)創(chuàng)的”AI 議會(huì)”機(jī)制,針對(duì)每個(gè)提示同時(shí)呈現(xiàn)兩個(gè)模型答案,既滿足用戶多樣化需求,又能有效識(shí)別模型”幻覺”。正如 CEO Pankaj Gupta 所強(qiáng)調(diào),并排輸出結(jié)果對(duì)關(guān)注生成錯(cuò)誤的用戶尤為有益,便于交叉驗(yàn)證。平臺(tái)已接入 500 多款 AI 模型,涵蓋 ChatGPT、Claude、Gemini 等主流模型及眾多新興產(chǎn)品,并推出”QuickTake”功能將長(zhǎng)回復(fù)提煉為推文級(jí)內(nèi)容。
在用戶體驗(yàn)方面,Yupp 采取徹底的隱私保護(hù)策略:所有聊天記錄默認(rèn)私密,用戶可自主控制分享范圍;即使公開分享也不泄露任何個(gè)人信息。經(jīng)濟(jì)模型設(shè)計(jì)巧妙,將免費(fèi)使用與用戶反饋深度結(jié)合。新用戶注冊(cè)即獲 5000 積分,通過(guò)評(píng)分、選擇偏好等互動(dòng)可持續(xù)賺取積分,確保免費(fèi)使用高端模型。平臺(tái)推出”數(shù)字刮刮卡”機(jī)制,每次提問后用戶可贏取 0-250 不等積分,1000 積分兌換 1 美元,每日最高提現(xiàn) 10 美元,支持 20 余種貨幣兌換。特別值得一提的是,平臺(tái)集成 Base Ethernet L2 和 Solana 穩(wěn)定幣,為全球用戶提供即時(shí)無(wú)手續(xù)費(fèi)獎(jiǎng)勵(lì)。
Yupp VIBE 評(píng)分系統(tǒng)是 AI 評(píng)估領(lǐng)域的重要?jiǎng)?chuàng)新。針對(duì)現(xiàn)有排行榜透明度不足、公平性欠缺等問題,該系統(tǒng)通過(guò)收集全球用戶自然交互中的偏好數(shù)據(jù),提供穩(wěn)健可信賴的評(píng)估結(jié)果。評(píng)估原則包括:保證代表性、真實(shí)性、抗作弊性;確保公平中立、透明公開、嚴(yán)謹(jǐn)科學(xué)。平臺(tái)不僅收集二元偏好數(shù)據(jù),還鼓勵(lì)用戶標(biāo)注回復(fù)優(yōu)缺點(diǎn),并根據(jù)用戶屬性進(jìn)行分群分析。技術(shù)層面,Yupp 正探索區(qū)塊鏈、密碼學(xué)原語(yǔ)及零知識(shí)證明等前沿技術(shù),確保評(píng)估過(guò)程公正可驗(yàn)證。
自 2025 年 6 月 13 日正式上線以來(lái),Yupp 持續(xù)迭代優(yōu)化:接入 Dall-E、Stable Diffusion 等多模態(tài)模型,支持圖像/PDF 提問;新增語(yǔ)音輸入與朗讀功能;引入 DeepSeek R1/V3、Mistral Small 3 等最新模型;實(shí)現(xiàn)實(shí)時(shí)信息查詢并附帶超鏈接引文;升級(jí)支付系統(tǒng)支持 PayPal 提現(xiàn)及 24 種貨幣;優(yōu)化分享導(dǎo)出功能;舉辦 AI 提示挑戰(zhàn)賽等活動(dòng)。Yupp 的使命是”賦能人類塑造 AI 的未來(lái)”,通過(guò)多視角 AI 回應(yīng)和用戶反饋,既幫助用戶更好決策,也為 AI 進(jìn)化提供持續(xù)動(dòng)力。
與 LMArena 等傳統(tǒng)評(píng)測(cè)平臺(tái)不同,Yupp 創(chuàng)新性地結(jié)合區(qū)塊鏈技術(shù)對(duì)用戶參與提供直接物質(zhì)獎(jiǎng)勵(lì)。雖然目前月度收益僅相當(dāng)于幾杯咖啡,但這些高質(zhì)量標(biāo)注數(shù)據(jù)對(duì) AI 公司至關(guān)重要。Yupp 的未來(lái)發(fā)展方向包括:持續(xù)提升數(shù)據(jù)質(zhì)量、防范作弊行為、平衡商業(yè)化與用戶激勵(lì)。這一創(chuàng)新平臺(tái)有望在 AI 生態(tài)中扮演關(guān)鍵角色,實(shí)現(xiàn)”人人皆享 AI,人人塑造 AI”的愿景,為人工智能發(fā)展注入更多民主化力量。
本文網(wǎng)址:http://iy168.cn/news/15988.html