“互聯(lián)網(wǎng)+”時代人人都是自媒體,人人都有麥克風(fēng),6.88億的中國網(wǎng)民都在通過微信、微博、論壇、貼吧、SNS、博客等網(wǎng)絡(luò)平臺發(fā)表言論、參與交流,匯集成網(wǎng)絡(luò)民意,形成網(wǎng)絡(luò)輿論。互聯(lián)網(wǎng)如今已經(jīng)成為收集民意、了解政府和企業(yè)工作成效的一個非常有效的途徑,各地政府及企業(yè)也越來越關(guān)注網(wǎng)絡(luò)輿情動態(tài)。
大數(shù)據(jù)視角下的輿情分析
海量的互聯(lián)網(wǎng)社交信息使社交輿情在大數(shù)據(jù)的應(yīng)用及落地方面具備了先天的優(yōu)勢和基礎(chǔ)。但大數(shù)據(jù)的價值不在信息本身,而在于通過分析數(shù)據(jù)的關(guān)聯(lián)性來指導(dǎo)決策及預(yù)測未來。社交輿情分析是網(wǎng)絡(luò)輿論引導(dǎo)的前提,而大數(shù)據(jù)技術(shù)為網(wǎng)絡(luò)輿情分析、預(yù)測提供了支撐和保證。大數(shù)據(jù)技術(shù)的應(yīng)用,就是挖掘、分析網(wǎng)絡(luò)輿情相關(guān)聯(lián)的數(shù)據(jù),將監(jiān)測的目標時間點提前到敏感消息進行網(wǎng)絡(luò)傳播的初期,通過建立的模型,模擬仿真實際網(wǎng)絡(luò)輿情演變過程,實現(xiàn)對網(wǎng)絡(luò)輿情預(yù)測。
輿情系統(tǒng)使用行業(yè)領(lǐng)先的大數(shù)據(jù)基礎(chǔ)平臺存儲海量的非結(jié)構(gòu)數(shù)據(jù),通過高效的算法分析模塊從豐富的數(shù)據(jù)集中挖掘出極具價值的信息,從浩瀚的數(shù)據(jù)宇宙中發(fā)掘事件苗頭、歸納輿論觀點傾向、掌握公眾態(tài)度情緒,全面實現(xiàn)為政府洞察熱點事件,為企業(yè)收集品牌、口碑、競爭對手等情報,幫助用戶第一時間發(fā)現(xiàn)輿情、跟蹤輿情、了解輿情發(fā)展的整個過程。
對大數(shù)據(jù)的采集加工是整個輿情分析服務(wù)的基礎(chǔ),掌握數(shù)據(jù)抓取能力與輿情解讀能力,通過“加工”實現(xiàn)數(shù)據(jù)的“增值”,是輿情分析的必備技能。社交輿情系統(tǒng)通過采用分布式數(shù)據(jù)采集系統(tǒng),高效、準確、實時的對覆蓋主流的微博、微信、知乎、豆瓣、貼吧、天涯等社交平臺數(shù)據(jù)進行采集。
如何對復(fù)雜大數(shù)據(jù)進行分析及解釋是輿情系統(tǒng)的關(guān)鍵,數(shù)據(jù)分析的模式是否科學(xué)將直接影響數(shù)據(jù)分析的質(zhì)量,也決定了輿情信息的價值。基于數(shù)據(jù)分析,能否提煉出獨到、高質(zhì)量的觀點,在凌亂紛繁的數(shù)據(jù)背后找到更符合客戶要求的有價值信息,這是大數(shù)據(jù)時代輿情最大的變量。社交輿情分析系統(tǒng),以文本分類、聚類、觀點傾向識別等計算機文本信息內(nèi)容識別技術(shù)為基礎(chǔ),以數(shù)據(jù)挖掘技術(shù)為核心,應(yīng)用不同的數(shù)據(jù)建模,包括關(guān)聯(lián)規(guī)則、序列模式、頻繁序列、決策樹分類、神經(jīng)元網(wǎng)絡(luò)、模糊聚類、異常檢測等多種數(shù)據(jù)挖掘算法,結(jié)合相應(yīng)的數(shù)據(jù)可視化方法,實現(xiàn)對輿情數(shù)據(jù)進行分析預(yù)測。