您好,歡迎來到易龍商務網!
【廣告】
發布時間:2021-10-06 07:19  








時序數據與關系型數據的差異
(1)較明顯的特征是時序數據都存在僅有的時間戳,并且以時間戳大小進行排序,以時間戳作為僅有標識進行區分,而關系型數據通常有其他字段作為標識,比如學生的數據通常使用學號作為僅有標識進行區分。
(2)時序數據并不關心關系,在汽車定位中,我們不需要了解這輛汽車的所有者的其他屬性,例如年齡、職業等等,也就不存在對汽車所有者的表的關聯。
(3)時序數據的數據量持續呈線性增長,每隔一定時間粒度就會產生新的數據,將會持續產生海量數據,因此數據量龐大。而關系型數據的增長通常不是隨著時間持續增長的,比如一所學校的學生的據量在一段時間內都是相對穩定的。
(4)時序數據很少會有更新操作,在某個時刻的測量值產生將不會發生變化,所以幾乎不需要對時序數據進行更新。對于關系型數據,則是已存在的數據經常發生更新,比如學生的個人信息,包括年齡、身高等屬性。
時序數據具有以下特點
周期性持續采集數據源的時序數據,對插入性能要求高,可能發生亂序情況或者丟失數據;時序數據量大,對存儲壓縮比敏感;數據源標簽屬性多樣化,修改頻次低;指標數據量大而變化小;查詢需求多樣:單數據源較新值、單數據源明細、單數據源過濾聚集、多維查詢、降采樣、滑動窗口查詢、數據源狀態演變圖、特定模式識別、趨勢預測、根因分析、閾值修正等。
時序數據庫遇到的挑戰
很多人可能認為在傳統關系型數據庫上加上時間戳一列就能作為時序數據庫。數據量少的時候確實也沒問題,但少量數據是展現的緯度有限,細節少,可置信低,更加不能用來做大數據分析。很明顯時序數據庫是為了解決海量數據場景而設計的。
可以看到時序數據庫需要解決以下幾個問題時序數據的寫入:如何支持每秒鐘上千萬上億數據點的寫入。時序數據的讀取:又如何支持在秒級對上億數據的分組聚合運算。成本敏感:由海量數據存儲帶來的是成本問題。如何更低成本的存儲這些數據,將成為時序數據庫需要解決的重中之重。這些問題不是用一篇文章就能涵蓋的,同時每個問題都可以從多個角度去優化解決。在這里只從數據存儲這個角度來嘗試回答如何解決大數據量的寫入和讀取。
時序數據的目的介紹
時間序列分析的目的是通過找出樣本內時間序列的統計特性和發展規律性,構建時間序列模型,進行樣本外預測。在建立模型時要求時間序列是平穩的,但實際進行分析的時間序列尤其是來自經濟領域的時間序列大多是非平穩的。這些非平穩的時間序列往往具有某些典型的數據特征。在建立模型時,往往根據序列表現出的數據特征考慮合適的時間序列模型。