
隨著云時代的到來和SaaS概念的引入,越來越多的企業開始選擇由SaaS應用提供商、運營商等通過互聯網平臺提供SaaS應用服務,SaaS應用的數據量面臨著TB級的增長速度;不同的SaaS應用體系,提供的數據結構也不完全相同,數據有文本、圖形甚至小型數據庫;SaaS應用數據隨著云服務平臺的分布性特點,有可能分布在不同的服務器上,如何對這些異構異源的數據進行數據挖掘,是云時代的企業面臨的難題。
云時代企業數據挖掘面臨的挑戰
挖掘效率:進入云計算時代后,BI的思路發生了轉換。以前是基于封閉的企業數據進行挖掘,而面對引入互聯網應用后海量的異構數據(據預計到2020年,爆發式增長的數據量將突破35ZB(1ZB=10億TB))時,目前并行挖掘算法的效率很低。
多源數據:引入云計算后,企業數據的位置有可能在提供公有云服務的平臺上,也可能在企業自建的私有云上,如何面對不同的數據源進行挖掘也是一個挑戰。
異構數據:Web數據的最大特點就是半結構化,如文檔、報表、網頁、聲音、圖像、視頻等,而云計算帶來了大量的基于互聯網模式提供的SaaS應用,如何梳理有效數據是一個挑戰。
SaaS應用的數據挖掘希望能夠通過海量數據存儲平臺,引入快速并行的挖掘算法,提高數據挖掘的質量。
CIO頻道人物視窗
CIO頻道方案案例庫
大數據建設方案案例庫
電子政務建設方案案例庫
互聯集成系統構建方案案例庫
商務智能建設方案案例庫
系統集成類軟件信息研發企業名錄