期刊大全 雜志訂閱 SCI期刊 投稿指導(dǎo) 期刊服務(wù) 文秘服務(wù) 出版社 登錄/注冊(cè) 購(gòu)物車(0)

首頁(yè) > 精品范文 > 網(wǎng)絡(luò)輿情分析研究現(xiàn)狀

網(wǎng)絡(luò)輿情分析研究現(xiàn)狀精品(七篇)

時(shí)間:2023-06-07 15:46:56

序論:寫作是一種深度的自我表達(dá)。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內(nèi)心深處的真相,好投稿為您帶來(lái)了七篇網(wǎng)絡(luò)輿情分析研究現(xiàn)狀范文,愿它們成為您寫作過(guò)程中的靈感催化劑,助力您的創(chuàng)作。

網(wǎng)絡(luò)輿情分析研究現(xiàn)狀

篇(1)

關(guān)鍵詞:微博; 輿情監(jiān)測(cè); 輿情分析; Scool; NoSQL

中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):2095-2163(2013)02-0050-04

0引言

目前,隨著網(wǎng)絡(luò)全球化的進(jìn)程加快以及移動(dòng)技術(shù)的推廣,微博已經(jīng)成為了網(wǎng)絡(luò)輿情的主要源頭和有效傳播路徑。由于微博具有的進(jìn)入門檻低、操作便捷、互動(dòng)性強(qiáng)等特點(diǎn),近兩年在全國(guó)得到了迅速的普及,獲得廣泛的應(yīng)用。但是不可忽視的隱患也隨之呈現(xiàn)。微博已經(jīng)成為了各種謠言和違法信息滋生、蔓延的主要平臺(tái),對(duì)社會(huì)也造成了無(wú)法預(yù)知的不良影響。因此,開展微博的輿情監(jiān)控和分析研究已是大勢(shì)所趨,勢(shì)在必行。

1研究現(xiàn)狀

目前,已有針對(duì)網(wǎng)絡(luò)輿情分析和挖掘的軟件產(chǎn)品,較典型的有 Autonomy 網(wǎng)絡(luò)輿情聚成系統(tǒng)、Goonie 互聯(lián)網(wǎng)輿情監(jiān)測(cè)系統(tǒng)、TRS 互聯(lián)網(wǎng)輿情信息監(jiān)控系統(tǒng)、方正智思輿情預(yù)警輔助決策支持系統(tǒng)、中科點(diǎn)擊(北京)科技有限公司研發(fā)的軍犬網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)等。這些系統(tǒng)均能對(duì)網(wǎng)絡(luò)輿情發(fā)揮一定的監(jiān)測(cè)、分析和預(yù)警的作用,為社會(huì)和諧穩(wěn)定提供了有效的技術(shù)和決策支持。雖然如此,但針對(duì)微博輿情監(jiān)測(cè)和分析的大部分系統(tǒng)卻沒有充分考慮到微博用戶基數(shù)大、覆蓋面廣、數(shù)據(jù)量巨大、更新速度快的特點(diǎn),而在這種情況下,采用普通的關(guān)系數(shù)據(jù)庫(kù)顯然無(wú)法滿足要求,因此,引入NoSQL技術(shù)存儲(chǔ)數(shù)據(jù)則是一個(gè)頗有前景的發(fā)展方向。

2微博輿情傳播特點(diǎn)

基于上述對(duì)微博使用方式的分析,決定了微博輿情的傳播將具有如下特點(diǎn):

(1)信息生成和傳播簡(jiǎn)便。只要簡(jiǎn)單操作,就可以第一時(shí)間關(guān)注微博新聞中的相關(guān)人物,或轉(zhuǎn)發(fā)傳統(tǒng)新聞和論壇中的內(nèi)容,而且由于移動(dòng)終端對(duì)微博的支持,微博就超越了時(shí)間與地域的限制,完全實(shí)現(xiàn)了微博的簡(jiǎn)便簡(jiǎn)易性。

(2)傳播信息快捷。僅以“7 .23”動(dòng)車事件為例,2011 年7 月23 日晚20 點(diǎn)38 分事故發(fā)生,4分鐘后網(wǎng)友發(fā)出了第一條微博,比傳統(tǒng)媒體提早了兩個(gè)多小時(shí)。

(3)病毒爆發(fā)式的信息傳播模式。消息一經(jīng)發(fā)出,用戶的所有關(guān)注者都能收到,而這一群體再亦如此繼續(xù)向外傳播,則微博信息就呈現(xiàn)了病毒爆發(fā)式擴(kuò)散傳播的態(tài)勢(shì)。

3基于noSQL的數(shù)據(jù)庫(kù)設(shè)計(jì)

NoSQL最初出現(xiàn)于2009年6月11日由Oskarsson在舊金山發(fā)起并組織的一個(gè)非正式會(huì)議上。NoSQL是當(dāng)下數(shù)據(jù)庫(kù)家族的外來(lái)者,雖然有些通用的特征,但卻沒有一個(gè)特征得到了明確定義。

根據(jù)輿情監(jiān)控系統(tǒng)的數(shù)據(jù)實(shí)際情況,在其系統(tǒng)的數(shù)據(jù)庫(kù)設(shè)計(jì)中引入NoSQL,當(dāng)寫入數(shù)據(jù)時(shí),可在MySQL、NoSQL中分別寫入一條數(shù)據(jù)的不同字段,而讀取數(shù)據(jù)時(shí),則從MySQL、NoSQL組合字段完成讀取。這一讀/寫過(guò)程如圖1所示。

在如圖1所示的組合結(jié)構(gòu)中,MySQL中存儲(chǔ)著需要查詢字段中的數(shù)字、時(shí)間等類型的小字段,其后按照查詢建立相應(yīng)的索引,而NoSQL中則存儲(chǔ)著包括大文本字段在內(nèi)的其他并不需要的字段。查詢過(guò)程可描述為,首先將數(shù)據(jù)主鍵從MySQL中查詢出來(lái),再?gòu)腘oSQL中直接取出對(duì)應(yīng)的數(shù)據(jù)。

文中設(shè)計(jì)的架構(gòu)模式使得MySQL和NoSQL能夠各自發(fā)揮所長(zhǎng),即由MySQL實(shí)現(xiàn)關(guān)系存儲(chǔ),而NoSQL則實(shí)現(xiàn)數(shù)據(jù)存儲(chǔ)。這種設(shè)計(jì)的優(yōu)點(diǎn)如下:節(jié)省MySQL的IO開銷、提高M(jìn)ySQl Query Cache緩存命中率、改進(jìn)了MySQL主從同步效率、提升了MySQL數(shù)據(jù)備份和恢復(fù)的速度、具有更好的擴(kuò)展性。

還需一提的是,這種以MySQL為主、NoSQL為輔的架構(gòu)設(shè)計(jì)與MySQL的單體架構(gòu)相比,系統(tǒng)的多樣性能和可擴(kuò)展性均得到了有效提高。

4基于微博的Scool輿情監(jiān)測(cè)分析系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

基于微博的Scool輿情監(jiān)測(cè)分析系統(tǒng)旨在取代傳統(tǒng)的人工收集和監(jiān)控工作,實(shí)現(xiàn)深入、高效挖掘,并實(shí)時(shí)得到微博網(wǎng)絡(luò)中相對(duì)敏感的輿論信息,以警示管理人員及時(shí)采取相應(yīng)措施。

基于微博的Scool輿情監(jiān)測(cè)分析系統(tǒng)的實(shí)現(xiàn)過(guò)程是,每日需定時(shí)、周期地對(duì)新浪微博、騰訊微博、網(wǎng)易微博、搜狐微博進(jìn)行網(wǎng)頁(yè)抓取后,并對(duì)其內(nèi)容實(shí)行解析后存入數(shù)據(jù)庫(kù),而后通過(guò)分詞索引以建立搜索引擎,實(shí)現(xiàn)數(shù)據(jù)索引,再通過(guò)用戶設(shè)定的關(guān)鍵詞庫(kù)對(duì)采集的數(shù)據(jù)進(jìn)行關(guān)鍵詞集過(guò)濾,由此獲得敏感輿情信息文本返回給用戶界面。系統(tǒng)還應(yīng)對(duì)收集的信息進(jìn)行自然語(yǔ)言處理,從而識(shí)別得到熱點(diǎn)話題和熱門事件。

4.1軟件體系結(jié)構(gòu)

系統(tǒng)分為后臺(tái)數(shù)據(jù)分析模塊和前臺(tái)數(shù)據(jù)展示模塊。后臺(tái)模塊負(fù)責(zé)實(shí)現(xiàn)數(shù)據(jù)抓取與分析,是系統(tǒng)的核心。前臺(tái)模塊負(fù)責(zé)完成微博、Web數(shù)據(jù)展示和基本維護(hù)操作。

4.1.1前臺(tái)結(jié)構(gòu)

前臺(tái)展示程序分為四大塊,分別是:輿情信息展示、輿情搜索、用戶監(jiān)控網(wǎng)址和關(guān)鍵詞設(shè)置、用戶登錄與管理。其中,輿情整體全面展示則按五類來(lái)進(jìn)行和表現(xiàn),分別是:最新輿情展示、按網(wǎng)站類型展示、按監(jiān)控網(wǎng)址展示、按話題事件展示和輿情統(tǒng)計(jì)。前臺(tái)模塊的結(jié)構(gòu)框架如圖2所示。

前臺(tái)展示程序主要基于JAVA開源SSH框架來(lái)進(jìn)行構(gòu)建而得以實(shí)現(xiàn),其設(shè)計(jì)結(jié)構(gòu)如圖3所示。

在本系統(tǒng)的架構(gòu)設(shè)計(jì)中,將在表示層上構(gòu)設(shè)的Struts框架,在業(yè)務(wù)邏輯層構(gòu)設(shè)的Spring框架以及在數(shù)據(jù)訪問(wèn)層構(gòu)設(shè)

(1)表現(xiàn)層使用JSP來(lái)實(shí)現(xiàn)構(gòu)建,為客戶端提供對(duì)應(yīng)用程序的訪問(wèn);

(2)控制層接受客戶端的請(qǐng)求,并根據(jù)不同的請(qǐng)求調(diào)用相應(yīng)的事務(wù)邏輯,再將處理結(jié)果返回到相關(guān)的頁(yè)面;

(3)業(yè)務(wù)邏輯層用來(lái)提供相關(guān)的業(yè)務(wù)邏輯;

(4)數(shù)據(jù)訪問(wèn)層提供對(duì)數(shù)據(jù)庫(kù)的各種操作。

系統(tǒng)設(shè)計(jì)中的三大框架有機(jī)配合、協(xié)調(diào)統(tǒng)一,其各自實(shí)現(xiàn)功能為:

在表現(xiàn)層中,由Struts框架負(fù)責(zé)處理JSP頁(yè)面的請(qǐng)求和轉(zhuǎn)發(fā)工作;在系統(tǒng)中用Hibernate來(lái)封裝數(shù)據(jù)庫(kù)的連接類,通過(guò)該框架所提供的注解方式實(shí)現(xiàn)了實(shí)體類與數(shù)據(jù)庫(kù)表結(jié)構(gòu)間的映射關(guān)系,并由該框架完成在數(shù)據(jù)訪問(wèn)層與數(shù)據(jù)庫(kù)間的交互工作,再通過(guò)Hibernate框架的二級(jí)緩存EHCache提供對(duì)用戶關(guān)鍵詞和行業(yè)惡劣情感詞的高效緩存。此外,系統(tǒng)使用Spring框架作為系統(tǒng)運(yùn)行輕量級(jí)的容器,負(fù)責(zé)在業(yè)務(wù)邏輯層處理業(yè)務(wù)邏輯工作。通過(guò)在配置文件中設(shè)置對(duì)象的創(chuàng)建方式及對(duì)象之間的關(guān)系,即可由Spring框架的IoC的容器來(lái)創(chuàng)建對(duì)象,同時(shí)也維護(hù)對(duì)象之間的依賴關(guān)系。通過(guò)這三大框架的整合,有效降低了系統(tǒng)中各模塊之間的相關(guān)性,由此形成一個(gè)結(jié)構(gòu)科學(xué)、功能強(qiáng)大和層次清晰的框架體系。

4.1.2后臺(tái)結(jié)構(gòu)

由圖6可知道,后臺(tái)結(jié)構(gòu)可分為數(shù)據(jù)緩沖池隊(duì)列,線程池線程和數(shù)據(jù)庫(kù)三部分。其中,緩存隊(duì)列負(fù)責(zé)數(shù)據(jù)流的來(lái)源,關(guān)鍵處理流程則拆分至各個(gè)線程中獨(dú)立實(shí)現(xiàn);線程控制數(shù)據(jù)緩存池中數(shù)據(jù)流的走向,各線程本身的并發(fā)運(yùn)行均交由線程池實(shí)現(xiàn)統(tǒng)一管理。數(shù)據(jù)庫(kù)則采用上述的NoSQL與關(guān)系數(shù)據(jù)庫(kù)相結(jié)合的對(duì)應(yīng)技術(shù)來(lái)主導(dǎo)實(shí)現(xiàn)。

4.2系統(tǒng)實(shí)現(xiàn)

用戶注冊(cè)、登錄系統(tǒng)后,可以點(diǎn)擊頁(yè)面上的相應(yīng)標(biāo)簽來(lái)查看有關(guān)的輿情記錄。同時(shí),系統(tǒng)也會(huì)將每天最新的輿情記錄完整、清晰地呈現(xiàn)。用戶還可以點(diǎn)擊更多的輿情鏈接來(lái)查看當(dāng)日之前任何一天的輿情記錄。

可以點(diǎn)擊系統(tǒng)主頁(yè)上的輿情搜索標(biāo)簽來(lái)進(jìn)行包含指定關(guān)鍵詞的輿情記錄,搜索頁(yè)面如圖7所示。在輸入框中輸入關(guān)鍵詞,就可以看到相關(guān)的信息。

5.結(jié)束語(yǔ)

在Scool輿情監(jiān)測(cè)和分析系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)過(guò)程中,有關(guān)信息存儲(chǔ)方面,本文主要提出了NoSQL和MySQL相結(jié)合的方法。實(shí)驗(yàn)證明,采用這種信息存儲(chǔ)的方法可節(jié)省MySQL的IO開銷、提高M(jìn)ySQL數(shù)據(jù)備份和恢復(fù)的速度、且比以前更容易實(shí)現(xiàn)擴(kuò)展。對(duì)其后類似系統(tǒng)的設(shè)計(jì)提供了有益借鑒,并顯示了一定參考價(jià)值。由于時(shí)間及技術(shù)的限制,測(cè)試和抓取的數(shù)據(jù)還不夠連續(xù)和充分,下一步仍可繼續(xù)完善和推進(jìn)這一方面的工作。

參考文獻(xiàn):

[1]賈焰,劉江寧. 微博的輿情特點(diǎn)及其謠言治理[J]. 圖書情報(bào)知識(shí),2012(6):7-9.

[2]張玉峰,何超. 基于Web挖掘的網(wǎng)絡(luò)智能分析研究[J]. ITA,2011(4):64-68.

[3]汝艷紅. 微博信息傳播的特點(diǎn)及發(fā)展趨勢(shì)[J]. 青年記者,2012(8):27-30.

[4]鐘瑛,劉利芳. 微博傳播的輿論影響力[J]. 新聞與傳播研究,2013(2):8-12.

[5]FOWLER M. NoSQL Distilled[M]. 2009:1-20

[6]齊海鳳. 網(wǎng)絡(luò)輿情熱點(diǎn)發(fā)現(xiàn)與事件跟蹤技術(shù)研究[D]. 哈爾濱:哈爾濱工程大學(xué),2006:11-30.