時(shí)間:2024-07-12|瀏覽:273
自 2022 年底以來(lái),人工智能 (AI) 一詞已成為主流用語(yǔ)的一部分。然而,每當(dāng)圍繞這項(xiàng)革命性技術(shù)的討論出現(xiàn)時(shí),焦點(diǎn)似乎主要集中在其使用尖端算法和驅(qū)動(dòng)這些系統(tǒng)的強(qiáng)大硬件等方面。
然而,一個(gè)同樣重要但經(jīng)常被忽視的組成部分是支持這些人工智能模型的數(shù)據(jù)集。在過(guò)去的一年里,越來(lái)越明顯的是,輸入這些復(fù)雜系統(tǒng)的信息的質(zhì)量和數(shù)量對(duì)人工智能系統(tǒng)的成功至關(guān)重要。但誰(shuí)來(lái)收集這些數(shù)據(jù)?我們?nèi)绾未_保這些數(shù)據(jù)的多樣性、準(zhǔn)確性和合乎道德?
傳統(tǒng)上,AI 數(shù)據(jù)收集一直是專(zhuān)家和專(zhuān)業(yè)團(tuán)隊(duì)的職責(zé)。這種方法雖然無(wú)疑會(huì)產(chǎn)生高質(zhì)量的數(shù)據(jù)集,但往往會(huì)導(dǎo)致 AI 訓(xùn)練過(guò)程中出現(xiàn)瓶頸,尤其是在引入個(gè)人偏見(jiàn)時(shí)。因此,這不僅僅是擁有足夠的數(shù)據(jù),而是擁有代表廣泛觀(guān)點(diǎn)和用例的正確數(shù)據(jù)。
在此背景下,有關(guān)“去中心化 AI 基礎(chǔ)設(shè)施”的討論最近開(kāi)始受到廣泛關(guān)注,特別是因?yàn)樗鼈優(yōu)閷?shí)現(xiàn) AI 數(shù)據(jù)收集民主化和加速該領(lǐng)域的創(chuàng)新提供了合法的解決方案。到目前為止,現(xiàn)成的 AI 基礎(chǔ)設(shè)施提供商 NeurochainAI 利用了一個(gè)名為“AI 挖礦”的社區(qū)驅(qū)動(dòng)模塊,允許個(gè)人參與各種數(shù)據(jù)收集和驗(yàn)證任務(wù)——有效地將其支持者變成了一個(gè)龐大、多樣化的數(shù)據(jù)收集網(wǎng)絡(luò)。
簡(jiǎn)化復(fù)雜問(wèn)題
從外部來(lái)看,分散式 AI 數(shù)據(jù)收集系統(tǒng)的優(yōu)點(diǎn)在于,它們能夠?qū)?fù)雜的任務(wù)分解為易于管理的、不需要專(zhuān)業(yè)知識(shí)的小部分。這種方法通常被稱(chēng)為“微工作”,幾乎任何受過(guò)基本培訓(xùn)的人都可以為 AI 開(kāi)發(fā)做出貢獻(xiàn)。
NeurochainAI 的“數(shù)據(jù)啟動(dòng)板”體現(xiàn)了這種方法,AI 開(kāi)發(fā)人員或公司首先提交數(shù)據(jù)收集或驗(yàn)證任務(wù)。然后,這些任務(wù)被細(xì)致地分解為任何人都可以遵循的指令。社區(qū)成員(稱(chēng)為“AI 礦工”)可以選擇他們感興趣的任務(wù),并使用各自的 DePIN(去中心化物理基礎(chǔ)設(shè)施網(wǎng)絡(luò))中的消費(fèi)者硬件完成這些任務(wù)——即利用消費(fèi)者硬件執(zhí)行計(jì)算任務(wù)的本地化數(shù)字生態(tài)系統(tǒng),從而將工作負(fù)載分配到設(shè)備網(wǎng)絡(luò)中。
收集到的數(shù)據(jù)隨后會(huì)由其他社區(qū)成員進(jìn)行驗(yàn)證,以確保準(zhǔn)確性和質(zhì)量。貢獻(xiàn)者會(huì)因其努力而獲得應(yīng)有的回報(bào),從而為人工智能開(kāi)發(fā)者和社區(qū)營(yíng)造出互利互惠的局面。
此外,NeurochainAI 的模型解決了人工智能最緊迫的挑戰(zhàn)之一:巨大的能源消耗。傳統(tǒng)的人工智能數(shù)據(jù)中心消耗大量電力,據(jù)估計(jì),到 2027 年,它們消耗的電力可能與整個(gè)荷蘭一樣多。
不僅如此,國(guó)際能源署的一項(xiàng)研究估計(jì),到 2026 年,這些數(shù)據(jù)中心的用電量可能會(huì)增加到 620 至 1,050 TWh,分別相當(dāng)于瑞典和德國(guó)的能源需求。NeurochainAI 的方法可以分散這種計(jì)算負(fù)載,從而有可能減少 AI 開(kāi)發(fā)的整體能源足跡。
開(kāi)拓新領(lǐng)域
從目前的情況來(lái)看,人工智能數(shù)據(jù)收集民主化的影響似乎相當(dāng)深遠(yuǎn)和令人興奮。通過(guò)消除與“僅限專(zhuān)家的數(shù)據(jù)收集”實(shí)踐相關(guān)的一些瓶頸,我們有可能看到人工智能應(yīng)用在歷史上因缺乏相關(guān)數(shù)據(jù)集而得不到充分服務(wù)的領(lǐng)域中出現(xiàn)爆炸式增長(zhǎng)。
例如,我們可以想象人工智能模型能夠理解和生成罕見(jiàn)語(yǔ)言的高質(zhì)量信息(這要?dú)w功于世界各地母語(yǔ)人士收集的數(shù)據(jù))。同樣,新的醫(yī)療人工智能用例也會(huì)出現(xiàn),例如那些可以識(shí)別罕見(jiàn)疾病癥狀的人工智能,這些人工智能是根據(jù)全球患者和醫(yī)護(hù)人員提供的數(shù)據(jù)進(jìn)行訓(xùn)練的??赡苄哉娴氖菬o(wú)窮無(wú)盡的!
最后但同樣重要的是,這種民主化方法可以帶來(lái)更道德和更透明的人工智能開(kāi)發(fā)。當(dāng)數(shù)據(jù)收集成為一項(xiàng)社區(qū)努力時(shí),這個(gè)過(guò)程本身就會(huì)有更多的監(jiān)督和多樣性。
因此,當(dāng)我們展望人工智能驅(qū)動(dòng)的未來(lái)時(shí),像 NeurochainAI 這樣的平臺(tái)不僅改變了我們收集人工智能數(shù)據(jù)訓(xùn)練信息的方式;它們還徹底重塑了這一領(lǐng)域的格局。
熱點(diǎn):數(shù)據(jù) 中心 人工智能 基礎(chǔ)設(shè)施