高清免费视频|成都冻货格|我可以再往深处一点吗视频|舌头伸进去添的我好爽高潮欧美|性都花花世家|无人区卡一卡二卡三乱码网站|草莓看视频在线观看免费

數(shù)據(jù)饑渴癥
發(fā)布時間:2015-09-15

Intel研究院院長吳甘沙在其最近的演講“大數(shù)據(jù)分析師的卓越之道” 中特別提到了外部數(shù)據(jù)采集問題, 原文如下:

第二個,數(shù)據(jù)采集,這里我非常夸張地強調(diào)“數(shù)據(jù)!數(shù)據(jù)!數(shù)據(jù)!”為什么?因為大數(shù)據(jù)碰到的第一個問題就是數(shù)據(jù)饑渴癥。我們有一次跟阿里聊,他們說也缺數(shù)據(jù),只有網(wǎng)上的銷售記錄,而缺乏無線的數(shù)據(jù)。所以我們強調(diào)全量數(shù)據(jù),我們盡量不采樣。

同時現(xiàn)在我們企業(yè)已經(jīng)從小數(shù)據(jù)到大數(shù)據(jù),有人說數(shù)據(jù)改變太困難了,太貴了,其實它強調(diào)的是問題還沒存在的時候。傳統(tǒng)的數(shù)據(jù)倉庫是,我先有一個問題,然后根據(jù)這個問題搜集和組織數(shù)據(jù)。從現(xiàn)在的大數(shù)據(jù)來說,需要先把數(shù)據(jù)送進來,然后再不斷的提問題,這就是一種新的思維。我們需要大量的外部數(shù)據(jù)源,而且你要從傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)到半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)。

對于外部數(shù)據(jù)饑渴癥,最好的方法之一就是采用樂思網(wǎng)絡(luò)信息采集系統(tǒng),可對任意外部Web數(shù)據(jù)加以采集整合,解決“巧婦難為無米之炊”的問題。例如,我們的一個客戶采集整合了大量法院的判決信息,資產(chǎn)信息,從而可在3秒鐘內(nèi)提供特定實體的資產(chǎn)與負(fù)債情況,很受律師界相關(guān)人士歡迎。