區(qū)塊鏈的技術(shù)定義
簡(jiǎn)單來(lái)說(shuō),,區(qū)塊鏈?zhǔn)且粋€(gè)提供了拜占庭容錯(cuò),、并保證了最終一致性的分布式數(shù)據(jù)庫(kù);從數(shù)據(jù)結(jié)構(gòu)上看,,它是基于時(shí)間序列的鏈?zhǔn)綌?shù)據(jù)塊結(jié)構(gòu),;從節(jié)點(diǎn)拓?fù)渖峡矗械墓?jié)點(diǎn)互為冗余備份,;從操作上看,,它提供了基于密碼學(xué)的公私鑰管理體系來(lái)管理賬戶。
或許以上概念過(guò)于抽象,,我來(lái)舉個(gè)例子,,你就好理解了,。
你可以想象有 100 臺(tái)計(jì)算機(jī)分布在世界各地,這 100 臺(tái)機(jī)器之間的網(wǎng)絡(luò)是廣域網(wǎng),,并且,,這 100 臺(tái)機(jī)器的擁有者互相不信任。
那么,,我們采用什么樣的算法(共識(shí)機(jī)制)才能夠?yàn)樗峁┮粋€(gè)可信任的環(huán)境,,并且使得:
節(jié)點(diǎn)之間的數(shù)據(jù)交換過(guò)程不可篡改,并且已生成的歷史記錄不可被篡改,;
每個(gè)節(jié)點(diǎn)的數(shù)據(jù)會(huì)同步到最新數(shù)據(jù),,并且會(huì)驗(yàn)證最新數(shù)據(jù)的有效性;
基于少數(shù)服從多數(shù)的原則,,整體節(jié)點(diǎn)維護(hù)的數(shù)據(jù)可以客觀反映交換歷史,。
區(qū)塊鏈就是為了解決上述問題而產(chǎn)生的技術(shù)方案。
我們結(jié)合以往講過(guò)的內(nèi)容,,和即將要講的內(nèi)容,,先提煉一下區(qū)塊鏈在技術(shù)上的 7 個(gè)特征,你先記住,,我們后續(xù)會(huì)慢慢道來(lái):
區(qū)塊鏈的存儲(chǔ)基于分布式數(shù)據(jù)庫(kù),;
數(shù)據(jù)庫(kù)是區(qū)塊鏈的數(shù)據(jù)載體,區(qū)塊鏈?zhǔn)墙灰椎臉I(yè)務(wù)邏輯載體,;
區(qū)塊鏈按時(shí)間序列化區(qū)塊數(shù)據(jù),,整個(gè)網(wǎng)絡(luò)有一個(gè)最終確定狀態(tài);
區(qū)塊鏈只對(duì)添加有效,,對(duì)其他操作無(wú)效,;
交易基于非對(duì)稱加密的公私鑰驗(yàn)證;
區(qū)塊鏈網(wǎng)絡(luò)要求拜占庭將軍容錯(cuò),;
共識(shí)算法能夠“解決”雙花問題,。
區(qū)塊鏈的核心技術(shù)組成
無(wú)論是公鏈還是聯(lián)盟鏈,至少需要四個(gè)模塊組成:P2P 網(wǎng)絡(luò)協(xié)議,、分布式一致性算法(共識(shí)機(jī)制),、加密簽名算法、賬戶與存儲(chǔ)模型,。
1. P2P 網(wǎng)絡(luò)協(xié)議
P2P 網(wǎng)絡(luò)協(xié)議是所有區(qū)塊鏈的最底層模塊,,負(fù)責(zé)交易數(shù)據(jù)的網(wǎng)絡(luò)傳輸和廣播、節(jié)點(diǎn)發(fā)現(xiàn)和維護(hù),。
通常我們所用的都是比特幣 P2P 網(wǎng)絡(luò)協(xié)議模塊,,它遵循一定的交互原則。比如:初次連接到其他節(jié)點(diǎn)會(huì)被要求按照握手協(xié)議來(lái)確認(rèn)狀態(tài),,在握手之后開始請(qǐng)求 Peer 節(jié)點(diǎn)的地址數(shù)據(jù)以及區(qū)塊數(shù)據(jù),。
這套 P2P 交互協(xié)議也具有自己的指令集合,,指令體現(xiàn)在在消息頭(Message Header) 的 命令(command)域中,這些命令為上層提供了節(jié)點(diǎn)發(fā)現(xiàn),、節(jié)點(diǎn)獲取,、區(qū)塊頭獲取、區(qū)塊獲取等功能,,這些功能都是非常底層,、非常基礎(chǔ)的功能,。如果你想要深入了解,,可以參考比特幣開發(fā)者指南中的 Peer Discovery 的章節(jié),。
2. 分布式一致性算法
在經(jīng)典分布式計(jì)算領(lǐng)域,,我們有 Raft 和 Paxos 算法家族代表的非拜占庭容錯(cuò)算法,以及具有拜占庭容錯(cuò)特性的 PBFT 共識(shí)算法,。
如果從技術(shù)演化的角度來(lái)看,,我們可以得出一個(gè)圖,其中,,區(qū)塊鏈技術(shù)把原來(lái)的分布式算法進(jìn)行了經(jīng)濟(jì)學(xué)上的拓展,。
(圖來(lái)自網(wǎng)絡(luò))
在圖中我們可以看到,,計(jì)算機(jī)應(yīng)用在最開始多為單點(diǎn)應(yīng)用,,高可用方便采用的是冷災(zāi)備,后來(lái)發(fā)展到異地多活,,這些異地多活可能采用的是負(fù)載均衡和路由技術(shù),,隨著分布式系統(tǒng)技術(shù)的發(fā)展,我們過(guò)渡到了 Paxos 和 Raft 為主的分布式系統(tǒng),。
而在區(qū)塊鏈領(lǐng)域,,多采用 PoW 工作量證明算法、PoS 權(quán)益證明算法,,以及 DPoS 代理權(quán)益證明算法,,以上三種是業(yè)界主流的共識(shí)算法,這些算法與經(jīng)典分布式一致性算法不同的是,,它們?nèi)谌肓私?jīng)濟(jì)學(xué)博弈的概念,,下面我分別簡(jiǎn)單介紹這三種共識(shí)算法。
PoW: 通常是指在給定的約束下,,求解一個(gè)特定難度的數(shù)學(xué)問題,,誰(shuí)解的速度快,誰(shuí)就能獲得記賬權(quán)(出塊)權(quán)利,。這個(gè)求解過(guò)程往往會(huì)轉(zhuǎn)換成計(jì)算問題,,所以在比拼速度的情況下,,也就變成了誰(shuí)的計(jì)算方法更優(yōu),以及誰(shuí)的設(shè)備性能更好,。
PoS: 這是一種股權(quán)證明機(jī)制,,它的基本概念是你產(chǎn)生區(qū)塊的難度應(yīng)該與你在網(wǎng)絡(luò)里所占的股權(quán)(所有權(quán)占比)成比例,它實(shí)現(xiàn)的核心思路是:使用你所鎖定代幣的幣齡(CoinAge)以及一個(gè)小的工作量證明,,去計(jì)算一個(gè)目標(biāo)值,,當(dāng)滿足目標(biāo)值時(shí),你將可能獲取記賬權(quán),。
DPoS: 簡(jiǎn)單來(lái)理解就是將 PoS 共識(shí)算法中的記賬者轉(zhuǎn)換為指定節(jié)點(diǎn)數(shù)組成的小圈子,,而不是所有人都可以參與記賬。這個(gè)圈子可能是 21 個(gè)節(jié)點(diǎn),,也有可能是 101 個(gè)節(jié)點(diǎn),,這一點(diǎn)取決于設(shè)計(jì),只有這個(gè)圈子中的節(jié)點(diǎn)才能獲得記賬權(quán),。這將會(huì)極大地提高系統(tǒng)的吞吐量,,因?yàn)楦俚墓?jié)點(diǎn)也就意味著網(wǎng)絡(luò)和節(jié)點(diǎn)的可控。
3. 加密簽名算法
由于我不是密碼學(xué)專業(yè)出身,,所以這個(gè)部分我會(huì)以介紹為主,。
在區(qū)塊鏈領(lǐng)域,應(yīng)用得最多的是哈希算法,。哈希算法具有抗碰撞性,、原像不可逆、難題友好性等特征,。
其中,,難題友好性正是眾多 PoW 幣種賴以存在的基礎(chǔ),在比特幣中,,SHA256 算法被用作工作量證明的計(jì)算方法,,也就是我們所說(shuō)的挖礦算法。
而在萊特幣身上,,我們也會(huì)看到 Scrypt 算法,,該算法與 SHA256 不同的是,需要大內(nèi)存支持,。而在其他一些幣種身上,,我們也能看到基于 SHA3 算法的挖礦算法。以太坊使用了 Dagger-Hashimoto 算法的改良版本,,并命名為 Ethash,,這是一個(gè) IO 難解性的算法。
當(dāng)然,,除了挖礦算法,,我們還會(huì)使用到 RIPEMD160 算法,,主要用于生成地址,眾多的比特幣衍生代碼中,,絕大部分都采用了比特幣的地址設(shè)計(jì),。
除了地址,我們還會(huì)使用到最核心的,,也是區(qū)塊鏈 Token 系統(tǒng)的基石:公私鑰密碼算法,。
在比特幣大類的代碼中,基本上使用的都是 ECDSA,。ECDSA 是 ECC 與 DSA 的結(jié)合,,整個(gè)簽名過(guò)程與 DSA 類似,所不一樣的是簽名中采取的算法為 ECC(橢圓曲線函數(shù)),。
從技術(shù)上看,,我們先從生成私鑰開始,其次從私鑰生成公鑰,,最后從公鑰生成地址,,以上每一步都是不可逆過(guò)程,,也就是說(shuō)無(wú)法從地址推導(dǎo)出公鑰,,從公鑰推導(dǎo)到私鑰。
圖來(lái)自《精通比特幣》一書
4. 賬戶與交易模型
從一開始的定義我們知道,,僅從技術(shù)角度可以認(rèn)為區(qū)塊鏈?zhǔn)且环N分布式數(shù)據(jù)庫(kù),,那么,多數(shù)區(qū)塊鏈到底使用了什么類型的數(shù)據(jù)庫(kù)呢,?
我在設(shè)計(jì)元界區(qū)塊鏈時(shí),,參考了多種數(shù)據(jù)庫(kù),有 NoSQL 的 BerkelyDB,、LevelDB,,也有一些幣種采用基于 SQL 的 SQLite。這些作為底層的存儲(chǔ)設(shè)施,,多以輕量級(jí)嵌入式數(shù)據(jù)庫(kù)為主,,由于并不涉及區(qū)塊鏈的賬本特性,這些存儲(chǔ)技術(shù)與其他場(chǎng)合下的使用并沒有什么不同,。
區(qū)塊鏈的賬本特性,,通常分為 UTXO 結(jié)構(gòu)以及基于 Accout-Balance 結(jié)構(gòu)的賬本結(jié)構(gòu),我們也稱為賬本模型,。UTXO 是“unspent transaction input/output”的縮寫,,翻譯過(guò)來(lái)就是指“未花費(fèi)的交易輸入輸出”。
這個(gè)區(qū)塊鏈中 Token 轉(zhuǎn)移的一種記賬模式,,每次轉(zhuǎn)移均以輸入輸出的形式出現(xiàn),;而在 Balance 結(jié)構(gòu)中,,是沒有這個(gè)模式的。