您好,歡迎來到易龍商務網!
發布時間:2021-10-11 15:38  
【廣告】








時序數據與關系型數據的差異
(1)較明顯的特征是時序數據都存在僅有的時間戳,并且以時間戳大小進行排序,以時間戳作為僅有標識進行區分,而關系型數據通常有其他字段作為標識,比如學生的數據通常使用學號作為僅有標識進行區分。
(2)時序數據并不關心關系,在汽車定位中,我們不需要了解這輛汽車的所有者的其他屬性,例如年齡、職業等等,也就不存在對汽車所有者的表的關聯。
(3)時序數據的數據量持續呈線性增長,每隔一定時間粒度就會產生新的數據,將會持續產生海量數據,因此數據量龐大。而關系型數據的增長通常不是隨著時間持續增長的,比如一所學校的學生的據量在一段時間內都是相對穩定的。
(4)時序數據很少會有更新操作,在某個時刻的測量值產生將不會發生變化,所以幾乎不需要對時序數據進行更新。對于關系型數據,則是已存在的數據經常發生更新,比如學生的個人信息,包括年齡、身高等屬性。
時序數據庫遇到的挑戰
很多人可能認為在傳統關系型數據庫上加上時間戳一列就能作為時序數據庫。數據量少的時候確實也沒問題,但少量數據是展現的緯度有限,細節少,可置信低,更加不能用來做大數據分析。很明顯時序數據庫是為了解決海量數據場景而設計的。
可以看到時序數據庫需要解決以下幾個問題時序數據的寫入:如何支持每秒鐘上千萬上億數據點的寫入。時序數據的讀取:又如何支持在秒級對上億數據的分組聚合運算。成本敏感:由海量數據存儲帶來的是成本問題。如何更低成本的存儲這些數據,將成為時序數據庫需要解決的重中之重。這些問題不是用一篇文章就能涵蓋的,同時每個問題都可以從多個角度去優化解決。在這里只從數據存儲這個角度來嘗試回答如何解決大數據量的寫入和讀取。
工業互聯網時代,時序數據庫為何如此重要?
工業互聯網的發展呈現出關鍵技術加速突破、基礎支撐日益完善、融合應用逐漸豐富、產業生態日趨成熟的良好態勢。
工業數據每一個采集點,每秒可產生多條數據,且每一條數據要有時間屬性,而且時間驅動的時序數據處理系統沒有業務的波峰、波谷,對系統的可靠性和處理速度要求高。
所以工業數據的一個非常明顯的特點就是和時間有關,這種“數據膨脹”帶來的存儲壓力,已經成為工業互聯網和數字化發展的痛點之一。