時間:2021-12-25|瀏覽:467
主要采用阿里云服務器,以及處理高并發(fā)能力相對較強,是OKEx躲過這兩次危機的原因。
眾所周知,19日因東京AWS節(jié)點故障,幾乎所有中國交易所都出現(xiàn)了故障。
其中火幣傳聞由于“為了追求速度犧牲了高可用,強制要求所有服務全部遷移至單可用區(qū),即此次故障的C區(qū),于此同時并沒有快捷有效的緊急應對預案,一旦出現(xiàn)單區(qū)故障,需要將所有服務遷移出去,數(shù)據(jù)也需要重建,時間成本非常高”,導致出現(xiàn)了非常嚴重、時間較長的全網(wǎng)宕機。
尷尬的是,22日由于出現(xiàn)劇烈波動行情,火幣再次首先出現(xiàn)全網(wǎng)故障,幣安等緊隨其后。過去一段時間來說,只要行情出現(xiàn)劇烈波動,幣安往往第一個出現(xiàn)問題。因此何一也在社群表示,求推薦參與王者榮耀、雙十一的技術人員,來解決高并發(fā)問題。
加密貨幣交易所雖然和傳統(tǒng)金融軟件相比用戶數(shù)并不多,但也有很多獨特的地方,例如是7乘24小時不間斷交易、有來自全球的用戶、行情常常突發(fā)劇烈波動等。尤其是像幣安這樣的全球性交易所,更容易出現(xiàn)故障。
此次很多人在討論,三大交易所中近期相對低調(diào)的OKEx,確實在這兩次幾乎全網(wǎng)的故障中全身而退,顯得有些與眾不同。也有用戶嘲笑OKEx流量變小所致。這似乎不合邏輯,因為二線交易所例如抹茶、庫幣、Gate也多次出現(xiàn)了故障。
OKEx坊間傳聞更重視技術。無論如何,這兩次全網(wǎng)宕機OKEx能夠相對獨善其身的原因到底是什么?我們聽聽OKEx自己是怎么看的。吳說區(qū)塊鏈采訪了OKEx相關技術負責人,內(nèi)容相對平實,以下采訪內(nèi)容代表OKEx方面觀點。
1、19日AWS節(jié)點故障,OKEx為何沒有出現(xiàn)問題?
回復:OKEx其實也有業(yè)務跑在AWS上,但更多服務在香港的阿里云服務器,所以此次沒有出現(xiàn)故障。選阿里云是歷史原因,因為用得更熟悉,服務更好一些。但也不見得這是優(yōu)勢,因為過往阿里云也出現(xiàn)過類似的(故障)問題。無論如何,如果真的存在將所有服務遷移到單一可用區(qū),這肯定不是一個理性的行為。
2、22日因為流量激增,OKEx沒有出現(xiàn)問題,原因是什么?
回復:我們很少因為突發(fā)的流量宕機,我們團隊還是認為,OKEx的系統(tǒng)穩(wěn)定性會更好一些。系統(tǒng)要達到高等級的服務質(zhì)量,是一個需要從頂層設計到體系化執(zhí)行的過程。一般來說,系統(tǒng)服務穩(wěn)定性,通常用SLA指標來衡量。比如,我們所說系統(tǒng)穩(wěn)定性達到4個9,即99.99%,表示的含義是每年系統(tǒng)服務中斷的時間在50分鐘以內(nèi)(指突發(fā)情況,不包括主動維護),我們可以比較接近這個數(shù)字。
3、也有觀點認為,是因為OKEx流量相對較小,所以才沒有出現(xiàn)宕機?
回復:從數(shù)據(jù)上來看,OKEx現(xiàn)貨方面會稍低一些,但合約衍生品和競爭對手相比是可以的,還有一些優(yōu)勢。不出現(xiàn)宕機的原因,我們認為還是自身技術能力和交易系統(tǒng)性能更好一些,能承擔的并發(fā)量更大。
4、OKEx其實在17-18年也出現(xiàn)了一些問題,但近兩年來確實相對不錯,請問是什么原因?
回復:我們很少因為突發(fā)的流量宕機,不過去年最后一個月故障比較多,主要是我們準備上統(tǒng)一賬戶,升級維護比較頻繁。
技術發(fā)展和升級有一個過程,具體的進步不太方便細說,但確實是在技術和風控上有了很多調(diào)整。
例如采用標記價格機制。在計算中采用了移動平均值機制,這一機制可以平滑過濾短時間內(nèi)的合約價格波動,有效減少了市場中異常波動產(chǎn)生的不必要強制平倉。最新推出的底層交易系統(tǒng)3.0版本,相較前一版本延時降低,瞬時成交峰值超過100萬次/分鐘,相較老系統(tǒng)穩(wěn)定性、并發(fā)能力都有很大提升。
5、統(tǒng)一賬戶的推進受到了很多討論,但也有人認為存在技術與風控上的難點,你怎么看?
回復:統(tǒng)一賬戶的確業(yè)務更復雜了,風控邏輯也更復雜了。統(tǒng)一賬戶也是有不同模式的,如果用戶選擇更激進的賬戶模式,有可能造成較大的損失,但是也有比較獨立的模式。目前統(tǒng)一賬戶已經(jīng)上線,老用戶會陸續(xù)切換過來,我們認為技術上的難點已經(jīng)解決。