
近年來大數(shù)據(jù)不斷地向社會各行各業(yè)滲透,為每一個領(lǐng)域帶來變革性影響,并且正在成為各行業(yè)創(chuàng)新的原動力和助推器。這一時期,互聯(lián)網(wǎng)社交互動技術(shù)的不斷發(fā)展創(chuàng)新,人們越來越習(xí)慣于通過微博、微信、博客、論壇等社交平臺去分享各種信息數(shù)據(jù)、表達(dá)訴求、建言獻(xiàn)策,每天傳播于這些平臺上的數(shù)據(jù)量高達(dá)幾百億甚至幾千億條,這些數(shù)量巨大的社交數(shù)據(jù)構(gòu)成了大數(shù)據(jù)的一個重要部分,這些數(shù)據(jù)對于政府收集民意動態(tài)、企業(yè)了解產(chǎn)品口碑、公司開發(fā)市場需求等發(fā)揮重要作用。
如今,雖然互聯(lián)網(wǎng)已經(jīng)成為收集民意、了解政府和企業(yè)工作成效的一個非常有效的途徑。然而由于缺乏對互聯(lián)網(wǎng)發(fā)貼等行為的必要監(jiān)管措施,在輿情危機(jī)事件發(fā)生后,難以及時有效獲取深層次、高質(zhì)量的網(wǎng)絡(luò)輿情信息,經(jīng)常造成輿情危機(jī)事件處置工作的被動。于是,重視對互聯(lián)網(wǎng)輿情的應(yīng)對,建立起“監(jiān)測、響應(yīng)、總結(jié)、歸檔”的輿情應(yīng)對體系是成為大數(shù)據(jù)時代政務(wù)工作的重要內(nèi)容之一。
在此背景下,輿情監(jiān)測及分析行業(yè)就是為適應(yīng)大數(shù)據(jù)時代的輿情監(jiān)測和服務(wù)而發(fā)展起來的。其主要專注于通過海量信息采集、智能語義分析、自然語言處理、數(shù)據(jù)挖掘,以及機(jī)器學(xué)習(xí)等技術(shù),不間斷地監(jiān)控網(wǎng)站、論壇、博客、微博、平面媒體、微信等信息,及時、全面、準(zhǔn)確地掌握各種信息和網(wǎng)絡(luò)動向,從浩瀚的大數(shù)據(jù)宇宙中發(fā)掘事件苗頭、歸納輿論觀點(diǎn)傾向、掌握公眾態(tài)度情緒、并結(jié)合歷史相似和類似事件進(jìn)行趨勢預(yù)測和應(yīng)對建議。
大數(shù)據(jù)在輿情監(jiān)測上的應(yīng)用價值
(一)大數(shù)據(jù)價值的核心:輿情預(yù)測
傳統(tǒng)網(wǎng)絡(luò)輿論引導(dǎo)工作的起點(diǎn),是對已發(fā)生的網(wǎng)絡(luò)輿情進(jìn)行監(jiān)測開始。然而這種方式的局限在于滯后性。大數(shù)據(jù)技術(shù)的應(yīng)用,就是挖掘、分析網(wǎng)絡(luò)輿情相關(guān)聯(lián)的數(shù)據(jù),將監(jiān)測的目標(biāo)時間點(diǎn)提前到敏感消息進(jìn)行網(wǎng)絡(luò)傳播的初期,通過建立的模型,模擬仿真實際網(wǎng)絡(luò)輿情演變過程,實現(xiàn)對網(wǎng)絡(luò)突發(fā)輿情的預(yù)測。
(二)大數(shù)據(jù)價值的條件:輿情全面
大數(shù)據(jù)技術(shù)要預(yù)測輿情,首要條件是對各種關(guān)聯(lián)的全面數(shù)據(jù)進(jìn)行分析計算。傳統(tǒng)數(shù)據(jù)時代,分析網(wǎng)民觀點(diǎn)或輿情走勢時,只關(guān)注網(wǎng)民跟帖態(tài)度和情緒,忽視了網(wǎng)民心理的變化;只關(guān)注文本信息,而較少關(guān)注圖像、視頻、語音等內(nèi)容;只觀察輿論局部變化,忽視其他群體的輿論變化;只解讀網(wǎng)民文字內(nèi)容,而忽視復(fù)雜多變的社會關(guān)系網(wǎng)絡(luò)。從輿情分析角度看,網(wǎng)民僅僅是信息海洋中的"孤獨(dú)僵尸",猶如蟻群能夠涌現(xiàn)高度智能,而單個螞蟻如附熱鍋到處亂竄。
大數(shù)據(jù)時代,突破了傳統(tǒng)數(shù)據(jù)時代片面化、單一化、靜態(tài)化的思維,開始立體化、全局化、動態(tài)化研究網(wǎng)絡(luò)輿情數(shù)據(jù),將看似無關(guān)緊要的輿情數(shù)據(jù)納入分析計算的范圍。
(三)大數(shù)據(jù)價值的基礎(chǔ):輿情量化
大數(shù)據(jù)預(yù)測輿情的價值實現(xiàn),必須建立在對已挖掘出的海量信息,利用數(shù)學(xué)模型進(jìn)行科學(xué)計算分析的基礎(chǔ)之上,其前提是各類相關(guān)數(shù)據(jù)的量化,即一切輿情信息皆可量化。但數(shù)據(jù)量化,不等同于簡單的數(shù)字化,而是數(shù)據(jù)的可計算化。要在關(guān)注網(wǎng)民言論的同時,統(tǒng)計持此意見的人群數(shù)量;在解讀網(wǎng)民言論文字內(nèi)容的同時,計算網(wǎng)民互動的社會關(guān)系網(wǎng)絡(luò)數(shù)量;對于網(wǎng)民情緒的變化,可通過量化的指標(biāo)進(jìn)行標(biāo)識等。
(四)大數(shù)據(jù)價值的關(guān)鍵:輿情關(guān)聯(lián)
數(shù)據(jù)背后是網(wǎng)絡(luò),網(wǎng)絡(luò)背后是人,研究網(wǎng)絡(luò)數(shù)據(jù)實際上是研究人組成的社會網(wǎng)絡(luò)。大數(shù)據(jù)技術(shù)預(yù)測輿情的價值實現(xiàn),最關(guān)鍵的技術(shù)就是對輿情間的關(guān)系進(jìn)行關(guān)聯(lián),將不再僅僅關(guān)注傳統(tǒng)意義上的因果關(guān)系,更多關(guān)注數(shù)據(jù)間的相關(guān)關(guān)系。按大數(shù)據(jù)思維,每一個數(shù)據(jù)都是一個節(jié)點(diǎn),可無限次地與其他關(guān)聯(lián)數(shù)據(jù)形成輿情鏈上的乘法效應(yīng)--類似微博裂變傳播路徑,數(shù)據(jù)裂變式的關(guān)聯(lián)狀態(tài)蘊(yùn)含著無限可能性。
大數(shù)據(jù)時代的輿情監(jiān)測瓶頸
目前,各地輿情監(jiān)測工作的主要手段仍以人工檢索為主,盡管也使用了市面相對成熟的相關(guān)搜索軟件進(jìn)行輔助搜索,但搜索輿情的技術(shù)仍采用傳統(tǒng)的二維搜索方式,即主題關(guān)鍵詞和網(wǎng)絡(luò)平臺二維坐標(biāo),由輿情員對采集的信息進(jìn)行二次加工成輿情產(chǎn)品。
但搜索的輿情信息結(jié)果多為一級文本信息,對于深層次的多級輿情信息,如新聞、微博后的評論,網(wǎng)民的社會關(guān)系,網(wǎng)民針對某一事件評論反映出的情緒變化,以及網(wǎng)民煽動性、行動性的言論、暗示等數(shù)據(jù)無法深度挖掘,仍靠人工采集和分析判斷。受制于輿情員的知識水平和價值判斷的不同,極有可能導(dǎo)致有價值的輿情信息丟失,無法準(zhǔn)確及時預(yù)測輿情走勢,大大降低了輿情監(jiān)測工作的效率、準(zhǔn)確性,增加了有價值輿情信息發(fā)現(xiàn)的偶然性和投機(jī)性,為重大突發(fā)事件的輿情預(yù)測埋下隱患。
大數(shù)據(jù)背景下輿情監(jiān)測的實現(xiàn)
對大數(shù)據(jù)的采集加工是整個輿情監(jiān)測的基礎(chǔ),掌握數(shù)據(jù)抓取能力,通過“加工”實現(xiàn)數(shù)據(jù)的“增值”是輿情監(jiān)測分析的必備技能。樂思網(wǎng)絡(luò)輿情監(jiān)測系統(tǒng)因配置自己研發(fā)不同于爬蟲技術(shù)的領(lǐng)先采集技術(shù),用戶不但可以監(jiān)測各種正文信息,還可配置系統(tǒng)采集獲取某些主題的最新回復(fù)內(nèi)容,并獲取其詳細(xì)信息,如查看數(shù),回復(fù)數(shù),回復(fù)人,回復(fù)時間等。許多網(wǎng)站結(jié)構(gòu)復(fù)雜或采用了Frame或采用了JavaScript動態(tài)寫入內(nèi)容或采用了Ajax技術(shù)實時自動刷新內(nèi)容,這些都是普通爬蟲技術(shù)很難處理或無法處理的。對于采集監(jiān)測到的信息,系統(tǒng)可以自動加以分類,以負(fù)面輿情,與我相關(guān),我的關(guān)注,專題跟蹤等欄目分類呈現(xiàn),讓用戶可以直奔主題,最快找到自己需要的信息。
對趨勢的研判則是大數(shù)據(jù)時代輿情監(jiān)測的目標(biāo)。如今人們能夠從浩如煙海的數(shù)據(jù)中挖掘信息、判斷趨勢、提高效益,但這遠(yuǎn)遠(yuǎn)不夠,信息爆炸的時代要求人們不斷增強(qiáng)關(guān)聯(lián)輿情信息的分析和預(yù)測,把監(jiān)測的重點(diǎn)從單純的收集有效數(shù)據(jù)向?qū)浨榈纳钊胙信型卣埂匪驾浨楸O(jiān)測系統(tǒng)對監(jiān)測到的負(fù)面信息實施專題重點(diǎn)跟蹤監(jiān)測,重點(diǎn)首頁進(jìn)行定時截屏監(jiān)測及特別頁面證據(jù)保存。監(jiān)測人員可以對系統(tǒng)自動識別分類后的信息進(jìn)行再次挑選和分類,并可以基于工作需要輕松導(dǎo)出含有分析數(shù)據(jù)圖表的輿情日報周報,減輕輿情數(shù)據(jù)分析,統(tǒng)計作圖的繁雜度。對于某些敏感信息,系統(tǒng)還可通過短信和郵件及時通知用戶,這樣用戶隨時都可遠(yuǎn)程掌握重要輿情的動態(tài)。
大數(shù)據(jù)時代需要大采集,大數(shù)據(jù)時代需要大分析,這是數(shù)據(jù)爆炸背景下的數(shù)據(jù)處理與應(yīng)用需求的體現(xiàn),而傳統(tǒng)的人工采集、人工監(jiān)測顯然難以滿足大數(shù)據(jù)背景下對數(shù)據(jù)需求及應(yīng)用的要求。樂思網(wǎng)絡(luò)輿情監(jiān)測平臺成功地實現(xiàn)了針對互聯(lián)網(wǎng)海量輿情自動實時的監(jiān)測、自動內(nèi)容分析和自動報警的功能,有效地解決了傳統(tǒng)的以人工方式對輿情監(jiān)測的實施難題,加快了網(wǎng)絡(luò)輿論的監(jiān)管效率,有利于組織力量展開信息整理、分析、引導(dǎo)和應(yīng)對工作,提高用戶對網(wǎng)絡(luò)突發(fā)輿情的公共事件應(yīng)對能力,加強(qiáng)互聯(lián)網(wǎng)“大數(shù)據(jù)”分析研判。
政府輿情監(jiān)測如何實現(xiàn)預(yù)警負(fù)面、危機(jī)公關(guān)和反饋民意?
互聯(lián)網(wǎng)時代 企業(yè)如何從網(wǎng)絡(luò)大數(shù)據(jù)中挖掘市場新需求
物價局如何化解負(fù)面價格輿情引發(fā)的危機(jī)?
網(wǎng)絡(luò)大數(shù)據(jù)挖掘如何促進(jìn)防災(zāi)減災(zāi)工作?
如何推進(jìn)消防負(fù)面輿情監(jiān)測工作化解消防輿情危機(jī)