1、來源多樣性:多源數據通常來自於不同的信息源,包括傳感器、社交網絡、數據挖掘、監控系統等等。
2、數據異構性:源數據因不同領域、不同格式、不同方言、不同語言等原因,導致數據信息特征的不同,使得數據的集成和融合變得復雜困難。
3、數據量龐大:隨著時間的推移,不斷積累的數據量逐漸增大,數據處理和分析的復雜度也隨之增加。
4、數據質量不壹:數據可能存在缺失、異常、錯誤等問題,進壹步增加了數據處理的難度。