初創(chuàng)公司顛覆AI范式打造分布式新模型

idea2003 ? 2025年5月4日 am10:40 ? 資訊

研究人員通過(guò)整合全球分布的GPU集群，成功融合私有與公開(kāi)數(shù)據(jù)，訓(xùn)練出一種新型大語(yǔ)言模型（LLM），這一突破性進(jìn)展可能徹底顛覆當(dāng)前人工智能的主流構(gòu)建范式。兩家采用非傳統(tǒng)路徑的AI初創(chuàng)公司Flower AI與Vana聯(lián)手打造了名為Collective-1的新模型。Flower AI開(kāi)發(fā)出允許訓(xùn)練任務(wù)分散至數(shù)百臺(tái)聯(lián)網(wǎng)計(jì)算機(jī)的技術(shù)，其方案已被多家企業(yè)用于無(wú)需集中算力或數(shù)據(jù)的AI模型訓(xùn)練。Vana則提供了包含X平臺(tái)、Reddit及Telegram隱私消息在內(nèi)的多元化數(shù)據(jù)源。

按現(xiàn)代標(biāo)準(zhǔn)衡量，Collective-1規(guī)模較小，其70億參數(shù)量與當(dāng)今最先進(jìn)模型（如支撐ChatGPT、Claude和Gemini的模型）動(dòng)輒數(shù)千億的參數(shù)規(guī)模相去甚遠(yuǎn)。劍橋大學(xué)計(jì)算機(jī)科學(xué)家、Flower AI聯(lián)合創(chuàng)始人Nic Lane指出，這種分布式方法有望突破Collective-1的規(guī)模限制。他透露Flower AI正在用傳統(tǒng)數(shù)據(jù)訓(xùn)練300億參數(shù)模型，并計(jì)劃今年晚些時(shí)候開(kāi)發(fā)千億參數(shù)模型——接近行業(yè)領(lǐng)軍者的水平。”這或?qū)氐赘淖內(nèi)藗儗?duì)AI的認(rèn)知，我們正全力推進(jìn)，”Lane表示。這家初創(chuàng)公司還將圖像與音頻納入訓(xùn)練，以創(chuàng)建多模態(tài)模型。

分布式建模還可能重塑AI行業(yè)的權(quán)力格局。當(dāng)前AI公司構(gòu)建模型依賴(lài)兩大支柱：海量訓(xùn)練數(shù)據(jù)與集中在數(shù)據(jù)中心的龐大算力——這些數(shù)據(jù)中心通過(guò)超高速光纖網(wǎng)絡(luò)連接先進(jìn)GPU集群。它們還嚴(yán)重依賴(lài)網(wǎng)絡(luò)抓取的公開(kāi)數(shù)據(jù)集（盡管部分涉及版權(quán)材料），包括網(wǎng)頁(yè)和圖書(shū)內(nèi)容。這種模式意味著，只有財(cái)力雄厚的企業(yè)及能獲取大量高端芯片的國(guó)家，才可能開(kāi)發(fā)最具價(jià)值的尖端模型。即便是Meta的Llama和深度求索的R1等開(kāi)源模型，也出自擁有大型數(shù)據(jù)中心的企業(yè)之手。而分布式方法讓中小企業(yè)和高校能通過(guò)整合分散資源開(kāi)發(fā)生態(tài)AI，或使缺乏傳統(tǒng)基礎(chǔ)設(shè)施的國(guó)家通過(guò)聯(lián)網(wǎng)多個(gè)數(shù)據(jù)中心構(gòu)建更強(qiáng)模型。

Lane認(rèn)為AI產(chǎn)業(yè)將日益青睞突破單一數(shù)據(jù)中心局限的新方法。”相比數(shù)據(jù)中心模式，分布式方案能更優(yōu)雅地?cái)U(kuò)展算力，”他解釋道。安全與新興技術(shù)中心AI治理專(zhuān)家Helen Toner評(píng)價(jià)Flower AI的方案”對(duì)AI競(jìng)爭(zhēng)與治理具有潛在重大意義”。她指出：”雖可能仍難匹敵最前沿技術(shù)，但作為快速跟隨策略頗具價(jià)值。”

分而治之分布式AI訓(xùn)練的核心在于重構(gòu)算力分配邏輯。構(gòu)建大語(yǔ)言模型需向系統(tǒng)輸入海量文本，通過(guò)調(diào)整參數(shù)使其生成有效響應(yīng)。傳統(tǒng)數(shù)據(jù)中心會(huì)將訓(xùn)練任務(wù)分割到不同GPU執(zhí)行，再定期整合為統(tǒng)一主模型。新技術(shù)使得原本需在大型數(shù)據(jù)中心完成的工作，可分散到相隔數(shù)英里、僅靠普通網(wǎng)絡(luò)連接的硬件設(shè)備上執(zhí)行。行業(yè)巨頭也在探索分布式學(xué)習(xí)。去年谷歌研究人員提出的”分布式路徑組合”（DiPaCo）新框架，提升了分布式訓(xùn)練效率。而為構(gòu)建Collective-1等模型，Lane與中英學(xué)者聯(lián)合開(kāi)發(fā)了名為Photon的新工具，其采用更高效的數(shù)據(jù)表征方式和訓(xùn)練共享整合方案。

Lane坦言該過(guò)程雖比傳統(tǒng)訓(xùn)練慢，但靈活性更強(qiáng)，可隨時(shí)添加硬件加速訓(xùn)練。Photon由北京郵電大學(xué)和浙江大學(xué)研究人員參與開(kāi)發(fā)，上月已開(kāi)源。Flower AI的合作方Vana則致力于讓用戶(hù)以新方式向AI構(gòu)建者共享個(gè)人數(shù)據(jù)——其軟件支持用戶(hù)貢獻(xiàn)來(lái)自X和Reddit等平臺(tái)的私有數(shù)據(jù)，并可規(guī)定使用范圍甚至獲得經(jīng)濟(jì)回報(bào)。Vana聯(lián)合創(chuàng)始人Anna Kazlauskas表示，此舉旨在挖掘未開(kāi)發(fā)數(shù)據(jù)潛力，同時(shí)賦予用戶(hù)更多控制權(quán)。”這些通常無(wú)法進(jìn)入AI模型的非公開(kāi)數(shù)據(jù)，首次被用于基礎(chǔ)模型訓(xùn)練，且用戶(hù)可擁有其數(shù)據(jù)所創(chuàng)模型的權(quán)益，”她強(qiáng)調(diào)。

倫敦大學(xué)學(xué)院計(jì)算機(jī)科學(xué)家Mirco Musolesi指出，分布式訓(xùn)練的關(guān)鍵價(jià)值在于解鎖新型數(shù)據(jù)：”將其應(yīng)用于前沿模型，可讓AI產(chǎn)業(yè)利用醫(yī)療、金融等領(lǐng)域的分散敏感數(shù)據(jù)訓(xùn)練，同時(shí)規(guī)避數(shù)據(jù)集中化風(fēng)險(xiǎn)。”

本文網(wǎng)址：http://iy168.cn/news/3805.html

贊 (0)

idea2003

鯨魚(yú)追高買(mǎi)入TRUMP虧損90萬(wàn)美元回吐48萬(wàn)盈利

上一篇 2025年5月4日 am9:38

Movement做市商丑聞：秘密合同影子顧問(wèn)揭露隱藏交易內(nèi)幕

下一篇 2025年5月4日 am10:40

資訊

交易時(shí)刻：PCE數(shù)據(jù)來(lái)襲前黃金再創(chuàng)新高，OpenAI新模型引爆Ghibli概念

每日行情重點(diǎn)數(shù)據(jù)回顧和趨勢(shì)分析，由PANews出品。 1.市場(chǎng)觀(guān)察關(guān)鍵詞：Ghibli、ETH、BTC 現(xiàn)貨黃金周五亞盤(pán)突破3070美元/盎司，刷新歷史新高，年內(nèi)漲幅已超16%。…

2025年3月29日
資訊

2024年加密騙局揭秘58億美元損失騙局內(nèi)幕

2024年對(duì)于Web3零售投資者來(lái)說(shuō)，無(wú)疑是一段黑暗而殘酷的時(shí)光。無(wú)數(shù)投資者在詐騙者和黑客的精心策劃下，血本無(wú)歸。盡管精確統(tǒng)計(jì)零售投資者損失的資金規(guī)模極為困難，但犯罪報(bào)告顯示，至少…

2025年3月28日
資訊

加密項(xiàng)目收益新模式探討代幣回購(gòu)與未來(lái)趨勢(shì)

金錢(qián)似乎在無(wú)形中掌控著一切。當(dāng)人們開(kāi)始重新審視“基本面”的價(jià)值時(shí)，往往意味著市場(chǎng)的風(fēng)向已經(jīng)悄然轉(zhuǎn)變。今天，我們將深入探討一個(gè)既簡(jiǎn)單又關(guān)鍵的問(wèn)題：代幣是否應(yīng)該產(chǎn)生收入？團(tuán)隊(duì)是否應(yīng)該考…

2025年3月14日
資訊

2025香港Web3嘉年華4月啟幕全球大咖共探區(qū)塊鏈未來(lái)

2025 香港 Web3 嘉年華即將于4月6日至9日在國(guó)際金融中心香港盛大舉行。這場(chǎng)為期四天的行業(yè)盛會(huì)由萬(wàn)向區(qū)塊鏈實(shí)驗(yàn)室與HashKey Group聯(lián)合主辦，將匯聚近40場(chǎng)以國(guó)風(fēng)四…

2025年3月19日
資訊

Hyperliquid：9% 的幣安，78% 的中心化

DEX 并不需要完全的去中心化，而是會(huì)比 CEX 更透明。撰文：佐爺最初，沒(méi)有人在意這場(chǎng)交易，這不過(guò)是一場(chǎng)鬧劇，一次「拔網(wǎng)線(xiàn)」，一個(gè)理念 ( 去中心化 ) 的滅絕，一條 L1 …

2025年4月1日
資訊

idea2003日?qǐng)?bào) | 幣安錢(qián)包推出「用CEX資金在DEX交易」功能；近期約8000枚沉寂5至7年的比特幣發(fā)生轉(zhuǎn)移

韓國(guó)5大加密交易所總用戶(hù)數(shù)達(dá)1629萬(wàn)人，占總?cè)丝诘?2%；FTX將于5月30日開(kāi)始支付主要債權(quán)人的破產(chǎn)索賠；加密貨幣單日交易量從美國(guó)大選的1260億美元的峰值跌至350億美元，下…

2025年3月31日
資訊

紅牛鈴鹿奪冠 Gate.io技術(shù)驅(qū)動(dòng)極速同行

2025年4月6日，備受矚目的F1日本大獎(jiǎng)賽在鈴鹿賽道圓滿(mǎn)落幕，上演了一場(chǎng)速度與激情的巔峰對(duì)決。F1紅牛車(chē)隊(duì)車(chē)手維斯塔潘以桿位發(fā)車(chē)，憑借出色的駕駛技術(shù)和賽車(chē)性能，一路領(lǐng)先并最終奪得…

2025年4月8日
資訊

從零到 120 億美元的范式改變計(jì)劃，走近 Paradigm 聯(lián)創(chuàng) Matt Huang 和他的「X 戰(zhàn)警學(xué)院」

Huang 和他的團(tuán)隊(duì)不僅在投資未來(lái)，他們一行行地書(shū)寫(xiě)著未來(lái)。撰文：Dom Cooke，Colossus Review 作者編譯：律動(dòng)小 Deep 編者按：文章詳細(xì)介紹了由馬特…

2025年4月8日
資訊

美銀策略師Hartnett：逢高拋售美股逢低買(mǎi)入黃金

在美元持續(xù)貶值預(yù)期、市場(chǎng)不確定性加劇以及避險(xiǎn)需求顯著提升等多重因素驅(qū)動(dòng)下，美銀全球策略師Michael Hartnett對(duì)黃金表現(xiàn)出強(qiáng)烈的看漲立場(chǎng)。這一觀(guān)點(diǎn)由張雅琦在相關(guān)報(bào)道中詳細(xì)…

2025年4月28日
資訊

Hamilton Lane揭秘代幣化如何顛覆萬(wàn)億資管格局

傳統(tǒng)金融機(jī)構(gòu)加速布局區(qū)塊鏈賽道：Hamilton Lane 聯(lián)合首席執(zhí)行官Erik Hirsch深度解析開(kāi)年以來(lái)，港亞控股、澳大利亞Monochrome、貝萊德、富達(dá)等全球知名機(jī)…

2025年4月29日