【廣告】
時(shí)序數(shù)據(jù)與關(guān)系型數(shù)據(jù)的差異
(1)較明顯的特征是時(shí)序數(shù)據(jù)都存在僅有的時(shí)間戳,并且以時(shí)間戳大小進(jìn)行排序,以時(shí)間戳作為僅有標(biāo)識(shí)進(jìn)行區(qū)分,而關(guān)系型數(shù)據(jù)通常有其他字段作為標(biāo)識(shí),比如學(xué)生的數(shù)據(jù)通常使用學(xué)號(hào)作為僅有標(biāo)識(shí)進(jìn)行區(qū)分。
(2)時(shí)序數(shù)據(jù)并不關(guān)心關(guān)系,在汽車定位中,我們不需要了解這輛汽車的所有者的其他屬性,例如年齡、職業(yè)等等,也就不存在對汽車所有者的表的關(guān)聯(lián)。
(3)時(shí)序數(shù)據(jù)的數(shù)據(jù)量持續(xù)呈線性增長,每隔一定時(shí)間粒度就會(huì)產(chǎn)生新的數(shù)據(jù),將會(huì)持續(xù)產(chǎn)生海量數(shù)據(jù),因此數(shù)據(jù)量龐大。而關(guān)系型數(shù)據(jù)的增長通常不是隨著時(shí)間持續(xù)增長的,比如一所學(xué)校的學(xué)生的據(jù)量在一段時(shí)間內(nèi)都是相對穩(wěn)定的。
(4)時(shí)序數(shù)據(jù)很少會(huì)有更新操作,在某個(gè)時(shí)刻的測量值產(chǎn)生將不會(huì)發(fā)生變化,所以幾乎不需要對時(shí)序數(shù)據(jù)進(jìn)行更新。對于關(guān)系型數(shù)據(jù),則是已存在的數(shù)據(jù)經(jīng)常發(fā)生更新,比如學(xué)生的個(gè)人信息,包括年齡、身高等屬性。
時(shí)序數(shù)據(jù)庫遇到的挑戰(zhàn)
很多人可能認(rèn)為在傳統(tǒng)關(guān)系型數(shù)據(jù)庫上加上時(shí)間戳一列就能作為時(shí)序數(shù)據(jù)庫。數(shù)據(jù)量少的時(shí)候確實(shí)也沒問題,但少量數(shù)據(jù)是展現(xiàn)的緯度有限,細(xì)節(jié)少,可置信低,更加不能用來做大數(shù)據(jù)分析。很明顯時(shí)序數(shù)據(jù)庫是為了解決海量數(shù)據(jù)場景而設(shè)計(jì)的。
可以看到時(shí)序數(shù)據(jù)庫需要解決以下幾個(gè)問題時(shí)序數(shù)據(jù)的寫入:如何支持每秒鐘上千萬上億數(shù)據(jù)點(diǎn)的寫入。時(shí)序數(shù)據(jù)的讀?。河秩绾沃С衷诿爰?jí)對上億數(shù)據(jù)的分組聚合運(yùn)算。成本敏感:由海量數(shù)據(jù)存儲(chǔ)帶來的是成本問題。如何更低成本的存儲(chǔ)這些數(shù)據(jù),將成為時(shí)序數(shù)據(jù)庫需要解決的重中之重。這些問題不是用一篇文章就能涵蓋的,同時(shí)每個(gè)問題都可以從多個(gè)角度去優(yōu)化解決。在這里只從數(shù)據(jù)存儲(chǔ)這個(gè)角度來嘗試回答如何解決大數(shù)據(jù)量的寫入和讀取。
工業(yè)互聯(lián)網(wǎng)時(shí)代,時(shí)序數(shù)據(jù)庫為何如此重要?
工業(yè)互聯(lián)網(wǎng)的發(fā)展呈現(xiàn)出關(guān)鍵技術(shù)加速突破、基礎(chǔ)支撐日益完善、融合應(yīng)用逐漸豐富、產(chǎn)業(yè)生態(tài)日趨成熟的良好態(tài)勢。
工業(yè)數(shù)據(jù)每一個(gè)采集點(diǎn),每秒可產(chǎn)生多條數(shù)據(jù),且每一條數(shù)據(jù)要有時(shí)間屬性,而且時(shí)間驅(qū)動(dòng)的時(shí)序數(shù)據(jù)處理系統(tǒng)沒有業(yè)務(wù)的波峰、波谷,對系統(tǒng)的可靠性和處理速度要求高。
所以工業(yè)數(shù)據(jù)的一個(gè)非常明顯的特點(diǎn)就是和時(shí)間有關(guān),這種“數(shù)據(jù)膨脹”帶來的存儲(chǔ)壓力,已經(jīng)成為工業(yè)互聯(lián)網(wǎng)和數(shù)字化發(fā)展的痛點(diǎn)之一。