時(shí)間:2023-08-27|瀏覽:230
過去幾年里,人們一直在談?wù)摂?shù)據(jù)時(shí)代,但對(duì)于數(shù)據(jù)時(shí)代的定義并不清晰。在此之前,我們只是感受到數(shù)據(jù)時(shí)代即將到來(lái),但真正的數(shù)據(jù)時(shí)代是以數(shù)據(jù)為中心的時(shí)代,數(shù)據(jù)具有自身的特征和屬性,網(wǎng)絡(luò)為數(shù)據(jù)服務(wù)。有了IPFS,這一切就有了可能。
我在8月14日在深圳的分布式存儲(chǔ)大會(huì)上做了關(guān)于《分布式存儲(chǔ)助力DT時(shí)代到來(lái)》的主題演講。演講中提到了數(shù)據(jù)時(shí)代的一些特征和現(xiàn)有的技術(shù),下面對(duì)這些內(nèi)容進(jìn)行梳理。
數(shù)據(jù)爆炸并不意味著我們已經(jīng)進(jìn)入了數(shù)據(jù)時(shí)代。提出數(shù)據(jù)時(shí)代的原因是大家意識(shí)到了數(shù)據(jù)的價(jià)值和數(shù)據(jù)量的爆發(fā),進(jìn)行了大數(shù)據(jù)計(jì)算和數(shù)據(jù)挖掘,似乎網(wǎng)絡(luò)要以數(shù)據(jù)為中心了。但我們并沒有建立起以數(shù)據(jù)為中心的基礎(chǔ)設(shè)施,缺乏適用于數(shù)據(jù)保存、流通和價(jià)值交換的協(xié)議、標(biāo)準(zhǔn)和網(wǎng)絡(luò)。
各種應(yīng)用帶來(lái)了海量的數(shù)據(jù),而且數(shù)據(jù)量以每年40%的速度增長(zhǎng)。但這并不意味著我們已經(jīng)進(jìn)入了數(shù)據(jù)時(shí)代,實(shí)際上我們?nèi)匀惶幱诰W(wǎng)絡(luò)時(shí)代,只是感覺到網(wǎng)絡(luò)技術(shù)似乎不太適應(yīng)以數(shù)據(jù)為中心的模式。因此出現(xiàn)了許多與數(shù)據(jù)相關(guān)的問題,比如濫用數(shù)據(jù)、用戶數(shù)據(jù)歸屬不明、App強(qiáng)制授權(quán)、隱私信息被不當(dāng)使用等等。此外,個(gè)人數(shù)據(jù)的流通也面臨困難,直接變現(xiàn)也很難實(shí)現(xiàn)。所有這些問題并不是互聯(lián)網(wǎng)協(xié)議可以解決的。
數(shù)據(jù)時(shí)代需要數(shù)據(jù)互聯(lián)。目前我們?nèi)匀惶幱诨ヂ?lián)網(wǎng)時(shí)代,即IT時(shí)代。互聯(lián)網(wǎng)以網(wǎng)絡(luò)為中心,各種協(xié)議實(shí)現(xiàn)了網(wǎng)絡(luò)節(jié)點(diǎn)之間的自由通信,比如TCP/IP、HTTP、DNS、TLS、OSPF和BGP等等。在互聯(lián)網(wǎng)中,每個(gè)節(jié)點(diǎn)都有一個(gè)網(wǎng)絡(luò)地址,每份內(nèi)容都定位于某個(gè)路徑之下。在這套協(xié)議的支持下,我們可以自由地在網(wǎng)絡(luò)上交流,但前提是要知道要訪問的內(nèi)容在哪里。
而數(shù)據(jù)時(shí)代應(yīng)該具有自身的特征,數(shù)據(jù)時(shí)代的協(xié)議套件應(yīng)該以數(shù)據(jù)的互聯(lián)為目標(biāo)。因此我提出了一個(gè)新詞:Interdata。這是一套建立在互聯(lián)網(wǎng)之上的協(xié)議,目標(biāo)是實(shí)現(xiàn)數(shù)據(jù)的定位、流通和交易。數(shù)據(jù)時(shí)代也可以稱為Interdata時(shí)代。
數(shù)據(jù)時(shí)代具有三個(gè)特征:每份數(shù)據(jù)都有自己的身份,數(shù)據(jù)之間的關(guān)系由數(shù)據(jù)本身來(lái)表達(dá),網(wǎng)絡(luò)支持?jǐn)?shù)據(jù)的自由流通。而這一切,目前可以通過IPFS來(lái)實(shí)現(xiàn)。
每份數(shù)據(jù)都有自己的身份。IPFS的協(xié)議套件中有一個(gè)叫Multiformats的部分,用來(lái)描述數(shù)據(jù)或網(wǎng)絡(luò)。在描述數(shù)據(jù)方面,通過哈希算法對(duì)數(shù)據(jù)進(jìn)行描述,從而實(shí)現(xiàn)數(shù)據(jù)的身份標(biāo)記。每個(gè)數(shù)據(jù)都有自己獨(dú)一無(wú)二的身份,無(wú)論數(shù)據(jù)身處何處。
當(dāng)數(shù)據(jù)有了獨(dú)一無(wú)二的身份后,就可以實(shí)現(xiàn)內(nèi)容尋址。與互聯(lián)網(wǎng)時(shí)代不同,你不需要知道數(shù)據(jù)在哪里,只需告訴網(wǎng)絡(luò)你要找哪個(gè)數(shù)據(jù),就能找到它。
打個(gè)比方,在互聯(lián)網(wǎng)時(shí)代,你要找一份數(shù)據(jù),你必須知道數(shù)據(jù)在具體哪個(gè)網(wǎng)址的哪個(gè)路徑下。然而在數(shù)據(jù)時(shí)代,數(shù)據(jù)本身有獨(dú)立的身份標(biāo)志,你只需利用這個(gè)標(biāo)志向網(wǎng)絡(luò)查詢即可。這就像在這個(gè)時(shí)代你要找某個(gè)人,只需知道他的電話號(hào)碼或微信,直接聯(lián)系即可,無(wú)需知道他在哪。這是一個(gè)巨大的突破。
數(shù)據(jù)之間的關(guān)系由數(shù)據(jù)本身來(lái)表達(dá)。數(shù)據(jù)之間存在關(guān)系,就像人與人、人與物之間存在關(guān)系一樣。當(dāng)數(shù)據(jù)具有身份后,這個(gè)身份就具備很多特征,其中之一就是與其他數(shù)據(jù)的關(guān)系。例如,一篇論文可能包含許多引用或?qū)嶒?yàn)結(jié)果。在互聯(lián)網(wǎng)時(shí)代或紙質(zhì)時(shí)代的論文中,引用只是一個(gè)標(biāo)記,但并不明確引用的內(nèi)容。而在數(shù)據(jù)時(shí)代或IPFS中,數(shù)據(jù)可以通過IPLD的方式進(jìn)行存儲(chǔ),其中包含許多關(guān)系。這些關(guān)系直接通過數(shù)據(jù)的身份進(jìn)行鏈接。因?yàn)闊o(wú)需進(jìn)行路徑尋址,你可以認(rèn)為數(shù)據(jù)之間是相互包含的。這形成了一個(gè)大的語(yǔ)義網(wǎng)絡(luò)。
類似于HTML超鏈接,但比HTML更強(qiáng)大,因?yàn)樗亲园?、?nèi)容尋址和自驗(yàn)證的。
網(wǎng)絡(luò)支持?jǐn)?shù)據(jù)的自由流通。在無(wú)需路徑尋址的情況下,用戶如何通過內(nèi)容的身份標(biāo)記直接訪問數(shù)據(jù)呢?這就是Libp2p協(xié)議套件在IPFS中的作用。
Libp2p實(shí)現(xiàn)了真正的點(diǎn)對(duì)點(diǎn)網(wǎng)絡(luò),用戶之間的連接是對(duì)等的,不存在服務(wù)器和客戶端的區(qū)分。用戶之間的連接是自由和全方位的,一個(gè)節(jié)點(diǎn)可以連接成百上千個(gè)節(jié)點(diǎn)以保證可靠性。Libp2p通過分布式哈希表(DHT)幫助內(nèi)容尋址,從底層實(shí)現(xiàn)了自由連接??梢院?jiǎn)單地理解為現(xiàn)在的移動(dòng)網(wǎng)絡(luò)中,隨時(shí)了解你的位置,當(dāng)有人找你時(shí),通過你的號(hào)碼直接找到你。不同的是,在數(shù)據(jù)網(wǎng)絡(luò)中,同一份數(shù)據(jù)可能存在多份,其中任何一份都具有相同的意義。因此Libp2p會(huì)根據(jù)網(wǎng)絡(luò)情況選擇合適的位置提供內(nèi)容。
與IT時(shí)代最大的不同之一是,整個(gè)協(xié)議套件是直接為數(shù)據(jù)服務(wù)的,網(wǎng)絡(luò)只是該套協(xié)議的
熱點(diǎn):ipfs 區(qū)塊鏈 區(qū)塊鏈技術(shù) 數(shù)據(jù)