【廣告】
時序數(shù)據(jù)與關(guān)系型數(shù)據(jù)的差異
(1)較明顯的特征是時序數(shù)據(jù)都存在僅有的時間戳,并且以時間戳大小進(jìn)行排序,以時間戳作為僅有標(biāo)識進(jìn)行區(qū)分,而關(guān)系型數(shù)據(jù)通常有其他字段作為標(biāo)識,比如學(xué)生的數(shù)據(jù)通常使用學(xué)號作為僅有標(biāo)識進(jìn)行區(qū)分。
(2)時序數(shù)據(jù)并不關(guān)心關(guān)系,在汽車定位中,我們不需要了解這輛汽車的所有者的其他屬性,例如年齡、職業(yè)等等,也就不存在對汽車所有者的表的關(guān)聯(lián)。
(3)時序數(shù)據(jù)的數(shù)據(jù)量持續(xù)呈線性增長,每隔一定時間粒度就會產(chǎn)生新的數(shù)據(jù),將會持續(xù)產(chǎn)生海量數(shù)據(jù),因此數(shù)據(jù)量龐大。而關(guān)系型數(shù)據(jù)的增長通常不是隨著時間持續(xù)增長的,比如一所學(xué)校的學(xué)生的據(jù)量在一段時間內(nèi)都是相對穩(wěn)定的。
(4)時序數(shù)據(jù)很少會有更新操作,在某個時刻的測量值產(chǎn)生將不會發(fā)生變化,所以幾乎不需要對時序數(shù)據(jù)進(jìn)行更新。對于關(guān)系型數(shù)據(jù),則是已存在的數(shù)據(jù)經(jīng)常發(fā)生更新,比如學(xué)生的個人信息,包括年齡、身高等屬性。
時序數(shù)據(jù)庫遇到的挑戰(zhàn)
很多人可能認(rèn)為在傳統(tǒng)關(guān)系型數(shù)據(jù)庫上加上時間戳一列就能作為時序數(shù)據(jù)庫。數(shù)據(jù)量少的時候確實也沒問題,但少量數(shù)據(jù)是展現(xiàn)的緯度有限,細(xì)節(jié)少,可置信低,更加不能用來做大數(shù)據(jù)分析。很明顯時序數(shù)據(jù)庫是為了解決海量數(shù)據(jù)場景而設(shè)計的。
可以看到時序數(shù)據(jù)庫需要解決以下幾個問題時序數(shù)據(jù)的寫入:如何支持每秒鐘上千萬上億數(shù)據(jù)點的寫入。時序數(shù)據(jù)的讀?。河秩绾沃С衷诿爰墝ι蟽|數(shù)據(jù)的分組聚合運算。成本敏感:由海量數(shù)據(jù)存儲帶來的是成本問題。如何更低成本的存儲這些數(shù)據(jù),將成為時序數(shù)據(jù)庫需要解決的重中之重。這些問題不是用一篇文章就能涵蓋的,同時每個問題都可以從多個角度去優(yōu)化解決。在這里只從數(shù)據(jù)存儲這個角度來嘗試回答如何解決大數(shù)據(jù)量的寫入和讀取。
工業(yè)互聯(lián)網(wǎng)時代,時序數(shù)據(jù)庫為何如此重要?
工業(yè)互聯(lián)網(wǎng)的發(fā)展呈現(xiàn)出關(guān)鍵技術(shù)加速突破、基礎(chǔ)支撐日益完善、融合應(yīng)用逐漸豐富、產(chǎn)業(yè)生態(tài)日趨成熟的良好態(tài)勢。
工業(yè)數(shù)據(jù)每一個采集點,每秒可產(chǎn)生多條數(shù)據(jù),且每一條數(shù)據(jù)要有時間屬性,而且時間驅(qū)動的時序數(shù)據(jù)處理系統(tǒng)沒有業(yè)務(wù)的波峰、波谷,對系統(tǒng)的可靠性和處理速度要求高。
所以工業(yè)數(shù)據(jù)的一個非常明顯的特點就是和時間有關(guān),這種“數(shù)據(jù)膨脹”帶來的存儲壓力,已經(jīng)成為工業(yè)互聯(lián)網(wǎng)和數(shù)字化發(fā)展的痛點之一。