期刊大全 雜志訂閱 SCI期刊 投稿指導 期刊服務 文秘服務 出版社 登錄/注冊 購物車(0)

首頁 > 精品范文 > 大數(shù)據(jù)分析論文

大數(shù)據(jù)分析論文精品(七篇)

時間:2023-03-14 15:12:39

序論:寫作是一種深度的自我表達。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內(nèi)心深處的真相,好投稿為您帶來了七篇大數(shù)據(jù)分析論文范文,愿它們成為您寫作過程中的靈感催化劑,助力您的創(chuàng)作。

大數(shù)據(jù)分析論文

篇(1)

關(guān)鍵詞:大數(shù)據(jù) 交易平臺 數(shù)據(jù)資源 數(shù)據(jù)分析服務 融合

1.引言

目前發(fā)展大數(shù)據(jù)產(chǎn)業(yè)已經(jīng)上升為國家戰(zhàn)略,大數(shù)據(jù)的價值也得到了社會的廣泛認可。眾多研究[1-5]表明,大數(shù)據(jù)不僅為政府治理開辟了新思路,還是企業(yè)創(chuàng)新的重要源泉和高??蒲械闹匾?。大數(shù)據(jù)交易平臺是整個大數(shù)據(jù)產(chǎn)業(yè)的基礎與核心,它使得數(shù)據(jù)資源可以在不同組織之間流動,從而讓單個組織能夠獲得更多、更全面的數(shù)據(jù)。這樣不僅提高了數(shù)據(jù)資源的利用效率,更重要的是,當一個組織擁有的數(shù)據(jù)資源不斷豐富和立體化,有助于其通過數(shù)據(jù)分析發(fā)現(xiàn)更多的潛在規(guī)律,從而對內(nèi)提高自身的效率,對外促進整個社會的不斷進步。

在現(xiàn)有的大數(shù)據(jù)交易平臺上,數(shù)據(jù)供應方和需求方各自供需信息,交易雙方瀏覽這些信息,如果發(fā)現(xiàn)合適的交易對象,則進行大數(shù)據(jù)資源的買賣,交易平臺只作為信息中介存在。這類大數(shù)據(jù)交易的本質(zhì),其實是單獨的大數(shù)據(jù)資源交易,現(xiàn)有平臺可以統(tǒng)稱為第一代大數(shù)據(jù)交易平臺。第一代大數(shù)據(jù)交易平臺在供需平衡、數(shù)據(jù)定價和時效性三個方面都存在較大的不足。本文針對這些不足進行改進,設計了一種全新的第二代大數(shù)據(jù)交易平臺,命名為:融合數(shù)據(jù)分析服務的大數(shù)據(jù)交易平臺,該平臺將數(shù)據(jù)資源交易與數(shù)據(jù)分析服務進行深度融合,實現(xiàn)了數(shù)據(jù)與服務的一體化交易。本研究不僅為當下正在建設的各類大數(shù)據(jù)交易平臺提供有益的借鑒,也豐富了大數(shù)據(jù)交易的基礎理論體系。

2.相關(guān)研究

目前大數(shù)據(jù)交易的相關(guān)研究中,比較有代表性的有:

(1)大數(shù)據(jù)的財產(chǎn)屬性和所有權(quán)。王玉林等[6]對大數(shù)據(jù)的財產(chǎn)屬性展開研究,認為大數(shù)據(jù)的法律屬性會直接影響大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展,而大數(shù)據(jù)交易實踐本身就反映出大數(shù)據(jù)具有財產(chǎn)屬性。但大數(shù)據(jù)與傳統(tǒng)的財產(chǎn)權(quán)客體存在較大不同,它符合信息財產(chǎn)的特征,是信息財產(chǎn)權(quán)的客體,應受到相關(guān)法律的保護。齊愛民等[7]從宏觀的角度分析了國家對于其主權(quán)范圍內(nèi)數(shù)據(jù)的所有權(quán),剖析了個人擁有的數(shù)據(jù)權(quán)以及數(shù)據(jù)的財產(chǎn)權(quán)。

(2)大數(shù)據(jù)的定價問題。劉朝陽[8]對大數(shù)據(jù)的定價問題展開研究,首先分析了大數(shù)據(jù)的基本特征、價值特征等定價基礎。接著討論了效用價格論、成本價格論等定價模式。最后分析了大數(shù)據(jù)的定價策略,并對大數(shù)據(jù)定價的雙向不確定問題進行了詳細論述。劉洪玉等[9]認為在大數(shù)據(jù)交易過程中,由于缺乏足夠的歷史參考,其數(shù)據(jù)資源的交易價格很難確定,因此提出一種基于競標機制的魯賓斯坦模型,用于大數(shù)據(jù)交易雙方進行討價還價,以求達成一個交易的均衡價格。翟麗麗等[10]從資產(chǎn)的期權(quán)價值角度來評估大數(shù)據(jù)資源的價值,并指出數(shù)據(jù)在不斷變化和更新,加上數(shù)據(jù)的非獨占性等情況的出現(xiàn),數(shù)據(jù)資產(chǎn)的價值可能會下降,最后綜合這些因素構(gòu)建了一個評估模型來計算數(shù)據(jù)資產(chǎn)的價值。

(3)大數(shù)據(jù)交易的安全與隱私保護。史宇航[11]認為非法的數(shù)據(jù)交易會對個人數(shù)據(jù)等高價值信息的安全造成影響,對非法數(shù)據(jù)交易的購買方和協(xié)助方都應進行處罰。提出應先明確數(shù)據(jù)的法律屬性,再以數(shù)據(jù)交易所為平臺進行交易,并對數(shù)據(jù)交易所的法律地位進行了分析。殷建立等[12]為應對大數(shù)據(jù)時代數(shù)據(jù)采集、交易等過程中的安全問題,綜合考慮技術(shù)、政策和管理平臺等方面的因素,構(gòu)建了一種個人數(shù)據(jù)溯源管理體系,該體系可在數(shù)據(jù)應用時實現(xiàn)個人數(shù)據(jù)的追蹤溯源,從而保護其個人隱私。王忠[13]認為大數(shù)據(jù)環(huán)境下強大的數(shù)據(jù)需求會導致個人數(shù)據(jù)的非法交易,為應對這種情況,應該建立個人數(shù)據(jù)交易許可機制,通過發(fā)放交易許可證、拍賣授予等措施實現(xiàn)隱私保護。

(4)大數(shù)據(jù)交易的發(fā)展現(xiàn)狀與問題。楊琪等[14]認為我國的大數(shù)據(jù)交易還處于行業(yè)發(fā)展的早期,大量數(shù)據(jù)源未被激活,原因是大數(shù)據(jù)產(chǎn)業(yè)價值鏈的各個專業(yè)環(huán)節(jié)發(fā)展滯后,并且對數(shù)據(jù)交易中的安全問題和隱私泄露等有較大的擔憂。應該對數(shù)據(jù)產(chǎn)品進行改造,使其更商品化,并且通過政府開放公共數(shù)據(jù)等措施逐漸消除數(shù)據(jù)流通中的安全顧慮。唐斯斯等[15]首先分析了我國大數(shù)據(jù)交易的發(fā)展特點、交易類型等現(xiàn)狀,接著指出目前大數(shù)據(jù)交易存在法律法規(guī)相對滯后、行業(yè)標準不完善、交易平臺定位不明確、數(shù)據(jù)質(zhì)量不高等問題,最后提出應加快相關(guān)法律和標準建設,并推動數(shù)據(jù)開放,加強交易方式的創(chuàng)新。

除了上述四個主要研究方向以外,李國杰等[16]從理論的角度分析了大數(shù)據(jù)研究在行業(yè)應用和科學研究方面的重要作用,這從客觀上反映了大數(shù)據(jù)流通的必要性。涂永前等[17]認為大數(shù)據(jù)時代企業(yè)管理和運用數(shù)據(jù)資源的相關(guān)成本會成為企業(yè)的主要交易成本,這會改變企業(yè)的組織結(jié)構(gòu),并導致企業(yè)邊界的變化,企業(yè)會進行多方向的擴張,這為促進大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的相關(guān)法律的制定提供了理論支持??偟膩砜?,由于大數(shù)據(jù)交易本身屬于較新的領域,因此相關(guān)研究總體上較少,已有研究也大多集中在上述幾個研究方向上。實際上,大數(shù)據(jù)交易平臺是實現(xiàn)大數(shù)據(jù)交易的重要載體,是大數(shù)據(jù)資源流通轉(zhuǎn)換的主要節(jié)點,交易平臺本身需要隨著整個大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展,不斷的改進和升級,而現(xiàn)有研究中恰恰缺少對大數(shù)據(jù)交易平臺本身進行創(chuàng)新的研究。由此,本文針對現(xiàn)有大數(shù)據(jù)交易平臺的不足,結(jié)合實際設計了一種全新的融合數(shù)據(jù)分析服務的大數(shù)據(jù)交易平臺,為實踐和科研提供借鑒和參考。

3.現(xiàn)有大數(shù)據(jù)交易平臺的不足

大數(shù)據(jù)本身作為一種新興事物,當把它作為一種商品進行交易時,其交易平臺的設計很自然會參照傳統(tǒng)的商品交易模式,即:交易雙方先供求信息,再經(jīng)過討價還價,達到一個均衡的價格則成交,賣方將大數(shù)據(jù)資源經(jīng)過脫敏處理后,交付給買方。目前無論是政府主導的大數(shù)據(jù)交易所,還是企業(yè)或者高校創(chuàng)建的大數(shù)據(jù)交易平臺,都是采用類似的交易模式,這也是第一代大數(shù)據(jù)交易平臺的突出特點。實際上大數(shù)據(jù)與傳統(tǒng)商品有很大的區(qū)別,照搬傳統(tǒng)商品的交易模式會出現(xiàn)很多問題。本文將從供需平衡、數(shù)據(jù)定價和時效性三個方面分析現(xiàn)有大數(shù)據(jù)交易平臺的不足。

3.1 數(shù)據(jù)供需的錯配

現(xiàn)有大數(shù)據(jù)交易平臺的第一點不足就是數(shù)據(jù)供需的錯配,即:供應方提供的數(shù)據(jù)資源往往不是需求方所需要的,而需求方需要的數(shù)據(jù)在交易平臺上找不到,即使有相近的數(shù)據(jù)資源,也存在很大的數(shù)據(jù)缺失或冗余,買回去也無法使用。對數(shù)據(jù)供應方來說,由于無法準確預知數(shù)據(jù)買方多樣性的需求,它只能從自身角度出發(fā),將可以公開的、并且自認為有價值的數(shù)據(jù)資源放到平臺上待售。對需求各異的買方來說,供應方提供的標準數(shù)據(jù)很難與自己的應用方向精準匹配,這也是目前大數(shù)據(jù)交易還不夠活躍的原因。當然,當供需雙方建立初步聯(lián)系以后,供應方甚至可以為需求方個性化定制大數(shù)據(jù)資源,但即使這樣,供需錯配的問題仍然無法解決,原因就在于單個的數(shù)據(jù)供應方無法提供多維的數(shù)據(jù)資源,只有多維的數(shù)據(jù)資源才具有較高的分析價值。

3.2 大數(shù)據(jù)資源定價困難

大數(shù)據(jù)資源定價困難是現(xiàn)有大數(shù)據(jù)交易平臺的第二點不足。大數(shù)據(jù)資源和普通商品不同,普通商品可以直接消費或者作為再加工的原材料,其價值都可以通過最終的消費品價格得到體現(xiàn)。而大數(shù)據(jù)本身的價值無法直接衡量,需求方購買它的目的是作為數(shù)據(jù)分析的信息源,但是否能發(fā)現(xiàn)潛在的規(guī)律還未可知。因此無法在購買前,準確判斷出待售數(shù)據(jù)資源的價值大小。此外,需求方在不確定某大數(shù)據(jù)資源是否能真正能給組織帶來收益情況下,很難給出一個較高的價格,這在客觀上會影響數(shù)據(jù)供應方的交易積極性,加大了供需雙方達成交易的難度。

3.3 數(shù)據(jù)的時效性不強

現(xiàn)有大數(shù)據(jù)交易平臺的第三點不足,就是數(shù)據(jù)資源的時效性不強。目前很多大數(shù)據(jù)交易平臺上待售的數(shù)據(jù)資源都以歷史數(shù)據(jù)為主,這是因為數(shù)據(jù)資源在交易前需要經(jīng)歷脫敏處理,將涉及政府信息安全、企業(yè)商業(yè)機密和個人隱私等敏感信息進行變換和替代。此外,供應方還需要對原始數(shù)據(jù)進行初步的清洗,整理成一定的數(shù)據(jù)格式集中存貯和交付,方便需求方進行數(shù)據(jù)分析。由于一般的數(shù)據(jù)供應方并不具備對大數(shù)據(jù)進行實時脫敏和清洗的能力,只能將采集到的數(shù)據(jù)資源,經(jīng)過一段時間的離線處理后,再放到交易平臺上,所以只能供應歷史數(shù)據(jù)。隨著社會節(jié)奏的不斷加快,歷史數(shù)據(jù)很可能并不能反映當下的真實情況,越來越多的數(shù)據(jù)分析都需要用到實時數(shù)據(jù)作為信息源,這是未來大數(shù)據(jù)交易必須克服的一個短板。

4.融合數(shù)據(jù)分析服務的大數(shù)據(jù)交易平臺設計

本文提出將數(shù)據(jù)分析服務融合到目前的大數(shù)據(jù)交易中,以此來克服現(xiàn)有交易平臺的不足,本節(jié)將首先對數(shù)據(jù)分析服務進行概念界定,再依次介紹平臺設計的總體思路和核心模塊的設計,具體如下。

4.1 數(shù)據(jù)分析服務的概念界定

數(shù)據(jù)分析是指運用各類數(shù)據(jù)處理模型和信息技術(shù)手段,對數(shù)據(jù)資源進行深度的挖掘,從而發(fā)現(xiàn)其中蘊含的規(guī)律,作為管理決策的依據(jù)。數(shù)據(jù)分析本身是一種能力,如果一個組織將其數(shù)據(jù)分析能力提供給其他組織或個人,并收取一定的費用,這就是數(shù)據(jù)分析服務。在大數(shù)據(jù)環(huán)境下,數(shù)據(jù)資源不僅體量巨大而且種類多,對數(shù)據(jù)分析能力的要求不斷提高。在這種情況下,只有少數(shù)組織具備獨立處理大數(shù)據(jù)的能力,其他的組織比如大量的中小企業(yè),都需要從組織外部尋求專業(yè)的數(shù)據(jù)分析服務,來滿足自身的需要。因此,數(shù)據(jù)分析服務和大數(shù)據(jù)資源一樣存在巨大的市場需求。

4.2 平臺設計的總體思路

本文將提出的融合數(shù)據(jù)分析服務的大數(shù)據(jù)交易平臺,定位為第二代大數(shù)據(jù)交易平臺,它將大數(shù)據(jù)資源交易與數(shù)據(jù)分析服務兩者進行深度融合,在交易平臺上實現(xiàn)數(shù)據(jù)與服務的一體化交易。大數(shù)據(jù)交易平臺的角色也從原來的數(shù)據(jù)資源買賣的信息中介,轉(zhuǎn)變?yōu)榇髷?shù)據(jù)綜合服務商。在融合后的大數(shù)據(jù)交易平臺上,數(shù)據(jù)需求方不再提交數(shù)據(jù)資源的需求信息,而是直接提出自己的應用方向和想要得到的結(jié)果,交易平臺再根據(jù)需求方的應用方向,反向匹配數(shù)據(jù)資源和數(shù)據(jù)分析服務。這個匹配的過程不是單一的數(shù)據(jù)集或服務的查找,而是對全平臺的數(shù)據(jù)資源進行有效整合,形成高價值的多維數(shù)據(jù),再結(jié)合復合型的數(shù)據(jù)分析技術(shù),得到最終的分析結(jié)果,最后將分析結(jié)果與基礎數(shù)據(jù)一同交付給需求方。交付基礎數(shù)據(jù)的目的,一是方便需求方進行分析結(jié)果的對照,為決策提供更精準的參考。二是需求方可以根據(jù)基礎數(shù)據(jù)進行衍生挖掘,進一步提高數(shù)據(jù)的利用效率。平臺設計的總體思路繪制成圖1。

圖1 平臺設計的總體思路

4.3 核心模塊的設計

融合數(shù)據(jù)分析服務的大數(shù)據(jù)交易平臺共劃分為四大模塊,具體如圖2所示。

圖2 融合數(shù)據(jù)分析服務的大數(shù)據(jù)交易平臺的主要模塊

系統(tǒng)管理模塊具體又分為用戶管理、系統(tǒng)維護和安全管理。安全管理是系統(tǒng)管理模塊的重點,主要包含三個方面的功能:第一,負責整個交易平臺的系統(tǒng)安全,通過對交易平臺進行實時監(jiān)控,阻止外部的非法入侵行為,保障平臺的正常運行。第二,對數(shù)據(jù)供應方提交的數(shù)據(jù)資源進行審核,如果發(fā)現(xiàn)是非法數(shù)據(jù),則阻止其交易,并及時將有關(guān)情況反饋給相關(guān)的政府監(jiān)管部門,由它們進行調(diào)查處理。第三,檢查所有數(shù)據(jù)是否經(jīng)過脫敏處理。如果發(fā)現(xiàn)部分數(shù)據(jù)存在未脫敏或者脫敏不合格的情況,交易平臺將負責對該數(shù)據(jù)資源進行脫敏處理,從而保護數(shù)據(jù)中的隱私不被泄露。

大數(shù)據(jù)資源池模塊、數(shù)據(jù)分析服務模塊和協(xié)同模塊是交易平臺的三大核心模塊,是數(shù)據(jù)與服務兩者融合并實現(xiàn)一體化交易的關(guān)鍵,本文接下來將對這三個核心模塊的功能進行詳細設計。

4.3.1 大數(shù)據(jù)資源池模塊

大數(shù)據(jù)資源池模塊主要包含三個方面的功能:數(shù)據(jù)資源格式的整理、數(shù)據(jù)的多維度整合、大數(shù)據(jù)資源的云存貯。具體如下。

(1)數(shù)據(jù)資源格式的整理。由于大數(shù)據(jù)交易平臺上的數(shù)據(jù)資源來自不同的數(shù)據(jù)供應方,因此其數(shù)據(jù)資源的格式會有較大的差異。如果不經(jīng)過格式整理就直接進行數(shù)據(jù)分析,很可能會因部分數(shù)據(jù)無法準確讀取,而影響數(shù)據(jù)處理的效率,嚴重者還會導致數(shù)據(jù)分析中斷。數(shù)據(jù)資源格式整理的主要任務是將同一類型數(shù)據(jù)的格式進行統(tǒng)一,對部分缺失的數(shù)據(jù)屬性進行補充,對錯誤的數(shù)據(jù)格式進行修正。

(2)數(shù)據(jù)的多維度整合。在上文3.1中提到供需錯配的一個重要原因,就是單個數(shù)據(jù)供應方無法提供高價值的多維數(shù)據(jù)。所謂多維數(shù)據(jù)是包含用戶或者行業(yè)多個背景和情境的大數(shù)據(jù)資源,這些多維數(shù)據(jù)使用戶或行業(yè)多個側(cè)面的信息產(chǎn)生了關(guān)聯(lián),有利于發(fā)現(xiàn)深層次的潛在規(guī)律。融合數(shù)據(jù)分析服務的大數(shù)據(jù)交易平臺應該作為數(shù)據(jù)整合的主體,將單個數(shù)據(jù)供應方提供的零散的數(shù)據(jù)資源,進行多維度的整合,當缺少某一個維度的數(shù)據(jù)時,再向相應的數(shù)據(jù)供應方進行定向的采集,最后得到相對完整的多維數(shù)據(jù),具有很高的分析價值。

(3)大數(shù)據(jù)資源的云存貯。大數(shù)據(jù)資源經(jīng)過格式整理和多維度整合以后,已經(jīng)可以作為數(shù)據(jù)分析服務的信息源。下一步就是將這些數(shù)據(jù)資源進行統(tǒng)一的云存貯,以便數(shù)據(jù)分析服務調(diào)用。以往部分大數(shù)據(jù)資源由于體量巨大或?qū)崟r更新的需要,無法上傳到交易平臺上,或者只提供部分調(diào)用接口。融合數(shù)據(jù)分析服務的大數(shù)據(jù)交易平臺通過建立云存貯中心,將整合后的多維數(shù)據(jù)進行統(tǒng)一存放和調(diào)用,有助于提高數(shù)據(jù)資源的存取效率。

4.3.2 數(shù)據(jù)分析服務模塊

數(shù)據(jù)分析服務模塊首先根據(jù)數(shù)據(jù)需求方的應用方向,匹配出合適的多維數(shù)據(jù)資源,再選擇相應的數(shù)據(jù)分析模型分配所需的計算能力,最后將得到的分析結(jié)果反饋給需求方。本文將數(shù)據(jù)分析服務劃分為三個大類:基礎性分析服務、高級分析服務、深度定制的分析服務。具體如下。

(1)基礎性分析服務?;A性分析服務是指那些常規(guī)的數(shù)據(jù)統(tǒng)計,比如:總體中不同對象的占比分析,基于不同屬性的關(guān)聯(lián)分析或相關(guān)性分析等。這些分析服務耗時較短,分析技術(shù)較為簡單,只要數(shù)據(jù)資源本身完備,就可以迅速得到結(jié)果?;A性分析服務由大數(shù)據(jù)交易平臺本身來提供,可以面對不同的需求方,實現(xiàn)快速交付。

(2)高級分析服務。高級分析服務是指那些較為復雜的數(shù)據(jù)分析服務,比如:精準的趨勢預測、全面的用戶興趣畫像、非結(jié)構(gòu)化的信息挖掘等。這些分析服務需要大量專業(yè)的數(shù)據(jù)處理技術(shù),比如:興趣建模、視頻分析,音頻分析、深度語義分析等,必須由大數(shù)據(jù)交易平臺對接第三方的數(shù)據(jù)分析服務商,由它們來提供高級分析服務。大數(shù)據(jù)交易平臺在同一數(shù)據(jù)分析領域,應引入多家數(shù)據(jù)分析服務商,通過動態(tài)的競爭,來保證服務的質(zhì)量。

(3)深度定制的分析服務。大數(shù)據(jù)分析目前還處在快速發(fā)展階段,很多前瞻性的技術(shù)還在試驗當中,應該說數(shù)據(jù)分析技術(shù)的發(fā)展相對于旺盛的現(xiàn)實需求來說是滯后的。當需要用的某一數(shù)據(jù)分析技術(shù),在目前的市場上還找不到現(xiàn)成的提供方時,就需要大數(shù)據(jù)交易平臺為其進行深度的定制,交易平臺通過多方位的研發(fā)能力評估,尋找合適的技術(shù)主體來進行專門的技術(shù)攻關(guān)。

4.3.3 協(xié)同模塊

協(xié)同模塊主要包含兩個方面的功能:數(shù)據(jù)分析服務之間的技術(shù)協(xié)同、交易各方的管理協(xié)同。具體如下。

(1)數(shù)據(jù)分析服務之間的技術(shù)協(xié)同。在面臨較為復雜的數(shù)據(jù)分析任務時,可能需要用到多個領域的數(shù)據(jù)分析技術(shù),這時單個的數(shù)據(jù)分析服務商可能無法獨立完成。因為不同的行業(yè)領域,都有其行業(yè)技術(shù)的獨特性,需要長時間的專業(yè)積累。在這種情況下,就需要多個數(shù)據(jù)分析服務商相互合作才能完成。數(shù)據(jù)分析服務之間的技術(shù)協(xié)同,就是通過一定的技術(shù)標準和操作規(guī)范,讓多個數(shù)據(jù)分析技術(shù)提供方,能夠在完成同一任務時,在技術(shù)上不沖突,能夠相互并行的完成對數(shù)據(jù)資源的處理,按時按質(zhì)的交付最終的分析結(jié)果。

(2)交易各方的管理協(xié)同。在融合數(shù)據(jù)分析服務的大數(shù)據(jù)交易平臺上,交易的參與者一共有四類,分別是數(shù)據(jù)資源的供應方、數(shù)據(jù)分析服務商、需求方和交易平臺自身。數(shù)據(jù)需求方在提交自己的應用方向和預期結(jié)果的同時,提交自己的交易預算。交易平臺根據(jù)需求方提交的應用方向和預期結(jié)果,對數(shù)據(jù)資源和數(shù)據(jù)分析服務進行反向的選擇。如果數(shù)據(jù)分析任務中只用到了基礎性分析服務,則整個交易為平臺方、需求方、數(shù)據(jù)資源供應方的三方交易。如果某數(shù)據(jù)分析任務,平臺自身無法完成,需要用到第三方的數(shù)據(jù)分析服務商,則整個交易包含了全部四類參與者,是一個四方交易。交易的基本原則是實現(xiàn)參與各方的利益共享。交易各方的具體利益分配如圖3所示。

圖3 交易各方的利益分配

需求方希望在獲得預期結(jié)果的同時,其支付的成本在可接受的范圍內(nèi)。交易平臺在對數(shù)據(jù)和服務進行反向匹配后,會出現(xiàn)兩種不同的情況:第一種情況是在原交易預算下,可以達到需求方預期的結(jié)果,則可成交。第二種情況是,原交易預算較低,在該預算下無法達到需求方要求的結(jié)果,這時交易平臺會和需求方溝通,提出新的報價,需求方經(jīng)過考慮后,與平臺進行討價還價,它們在價格上達成一致時才能完成交易。由于交易數(shù)據(jù)是整合后的多維數(shù)據(jù),因此原始數(shù)據(jù)資源供應方的收益,由平臺從總交易價中支付,具體的支付方式可分為平臺一次性買斷或按次數(shù)支付。同一數(shù)據(jù)資源對于不同的需求者來說,其價值是不一樣的,融合數(shù)據(jù)分析服務的大數(shù)據(jù)交易平臺根據(jù)最終的一體化交易成交價,反向?qū)?shù)據(jù)資源進行定價,相對于現(xiàn)有的大數(shù)據(jù)交易平臺來說,是一種進步。交易平臺的深度參與,會使數(shù)據(jù)交易的頻率加快,原始數(shù)據(jù)資源供應方會獲得更多的收益。數(shù)據(jù)分析服務商根據(jù)具體的數(shù)據(jù)分析任務,直接參與由平臺發(fā)起的競價,達成交易后由平臺支付。交易平臺本身的收益則是需求方支付額減去其他各方收益的差價。

5.融合數(shù)據(jù)分析服務的大數(shù)據(jù)交易平臺的優(yōu)勢

本文3.1到3.3中指出現(xiàn)有大數(shù)據(jù)交易平臺存在數(shù)據(jù)供需錯配、大數(shù)據(jù)資源定價困難、數(shù)據(jù)的時效性不強三大不足。融合數(shù)據(jù)分析服務的大數(shù)據(jù)交易平臺作為改進后的第二代大數(shù)據(jù)交易平臺,可以很好地克服上述三點不足。除了這三個方面的優(yōu)勢以外,由于融合后可實現(xiàn)數(shù)據(jù)與服務的一體化交易,這將擴大交易對象的覆蓋范圍,提升交易的活力,具體如下。

5.1 直接面向應用,從根本上避免了數(shù)據(jù)供需的錯配

在融合數(shù)據(jù)分析服務的大數(shù)據(jù)交易平臺上,需求方對交易平臺直接提出應用方向和預期結(jié)果。交易平臺對全平臺的數(shù)據(jù)進行多維度整合,如果缺失某個維度的數(shù)據(jù),可以進行定向的采集和補充,最后形成高價值的多維數(shù)據(jù)。這些多維數(shù)據(jù)才是真正具有分析價值的數(shù)據(jù)資源,這是單個數(shù)據(jù)供應方無法提供的。在得到多維數(shù)據(jù)后,結(jié)合平臺自身和第三方數(shù)據(jù)服務商的分析能力,得到最終的分析結(jié)果。交易平臺最后交付給需求方的是數(shù)據(jù)分析結(jié)果和基礎數(shù)據(jù),這種直接面向最終應用的大數(shù)據(jù)交易方式,從根本上避免了數(shù)據(jù)供需的錯配。

5.2 融合后定價更有根據(jù)

在現(xiàn)有的大數(shù)據(jù)平臺上,數(shù)據(jù)需求方是將數(shù)據(jù)資源買回去以后自己分析,而在購買數(shù)據(jù)資源之前,不能預知數(shù)據(jù)分析效果的好壞,因此無法進行有效的價值判斷,這是定價困難的關(guān)鍵點。在融合數(shù)據(jù)分析服務的大數(shù)據(jù)交易平臺上,需求方不再直接對數(shù)據(jù)資源付費,而是對最終的數(shù)據(jù)分析結(jié)果付費,并且數(shù)據(jù)分析結(jié)果是根據(jù)需求方的要求反向定制的,是符合需求方利益的。需求方可以通過評估預期結(jié)果對自身的重要性或收益的改進程度,給出適當?shù)慕灰最A算。交易平臺以該預算為參照,對數(shù)據(jù)和服務進行選擇,若出現(xiàn)原預算約束下無法實現(xiàn)預期結(jié)果的情況,交易平臺再與需求方進行溝通,雙方討價還價后達成交易。這樣相對于現(xiàn)有的大數(shù)據(jù)交易平臺來說,融合后定價更有依據(jù)。

5.3 融合后可提供實時數(shù)據(jù)

在融合數(shù)據(jù)分析服務的大數(shù)據(jù)交易平臺上,數(shù)據(jù)資源采用云存貯的模式,由平臺進行統(tǒng)一管理,這提高了數(shù)據(jù)資源的安全性。在數(shù)據(jù)安全有保障的前提下,由交易平臺出面和數(shù)據(jù)資源供應方進行實時數(shù)據(jù)的對接,將實時數(shù)據(jù)納入大數(shù)據(jù)資源池中。對于單個的數(shù)據(jù)資源供應方來說,實時的數(shù)據(jù)脫敏難度太大。但大數(shù)據(jù)交易平臺不一樣,它可以利用規(guī)模優(yōu)勢,組建強大的計算能力,對大數(shù)據(jù)資源進行實時的脫敏和清洗,極大地提高了數(shù)據(jù)資源的時效性。

5.4 融合后將擴大交易對象的覆蓋范圍,提升交易的活力

融合后可實現(xiàn)數(shù)據(jù)和服務的一體化交易,讓很多自身不具備數(shù)據(jù)分析能力的組織和個人,也能方便地利用大數(shù)據(jù),特別是大量的中小企業(yè),這將大大增加交易對象的覆蓋范圍。

交易對象的增多會促進交易頻率的增長,從而為數(shù)據(jù)資源供應方帶來更多的收益,這樣會提升它們參與交易的積極性,鼓勵它們供應更多的數(shù)據(jù)資源,從而提升交易的活力,整個大數(shù)據(jù)交易行業(yè)就形成了正向循環(huán)的良好發(fā)展態(tài)勢。

6結(jié)語

本文對大數(shù)據(jù)交易平臺本身進行了改進與創(chuàng)新,設計了一種全新的第二代大數(shù)據(jù)交易平臺,即:融合數(shù)據(jù)分析服務的大數(shù)據(jù)交易平臺。該交易平臺可以直接面向需求方的應用方向,實現(xiàn)數(shù)據(jù)和服務的一體化交易,不僅從根本上避免了數(shù)據(jù)供需的錯配,還使大數(shù)據(jù)交易的定價更有依據(jù),平臺的深度參也讓提供實時數(shù)據(jù)成為可能,這些將從整體上提升大數(shù)據(jù)交易的效率。融合后數(shù)據(jù)和服務的一體化交易降低了大數(shù)據(jù)應用的技術(shù)門檻,鼓勵更多組織和個人參與,增加了交易活力。未來筆者將繼續(xù)關(guān)注大數(shù)據(jù)交易平臺的創(chuàng)新研究,為實際應用和學術(shù)科研提供更多有益的參考。

參考文獻

[1]趙強,單煒.大數(shù)據(jù)政府創(chuàng)新:基于數(shù)據(jù)流的公共價值創(chuàng)造[J].中國科技論壇,2014(12):23-27.

[2]徐繼華,馮啟娜,陳貞汝.智慧政府:大數(shù)據(jù)治國時代的來臨[M].北京:中信出版社,2014.

[3]李文蓮,夏健明.基于“大數(shù)據(jù)”的商業(yè)模式創(chuàng)新[J].中國工業(yè)經(jīng)濟,2013(5):83-95.

[4]侯錫林,李天柱,馬佳,等.大數(shù)據(jù)環(huán)境下企業(yè)創(chuàng)新機會研究[J].科技進步與對策,2014,31(24):82-86.

[5]張峰,張迪.論大數(shù)據(jù)時代科研方法新特征及其影響[J].科學學研究,2016,34(2):166-170,202.

[6]王玉林,高富平.大數(shù)據(jù)的財產(chǎn)屬性研究[J]。圖書與情報,2016(1):29-35,43.

[7]齊愛民,盤佳.數(shù)據(jù)權(quán)、數(shù)據(jù)主權(quán)的確立與大數(shù)據(jù)保護的基本原則[J].蘇州大學學報:哲學社會科學版,2015(1):64-70.

[8]劉朝陽.大數(shù)據(jù)定價問題分析[J].圖書情報知識,2016(1):57-64.

[9]劉洪玉,張曉玉,侯錫林.基于討價還價博弈模型的大數(shù)據(jù)交易價格研究[J].中國冶金教育,2015(6):86-91.

[10]翟麗麗,王佳妮,何曉燕.移動云計算聯(lián)盟企業(yè)數(shù)據(jù)資產(chǎn)評估方法研究[J].價格理論與實踐,2016(2):153-156.

[11]史宇航.個人數(shù)據(jù)交易的法律規(guī)制[J].情報理論與實踐,2016,39(5):34-39.

[12]殷建立,王忠.大數(shù)據(jù)環(huán)境下個人數(shù)據(jù)溯源管理體系研究[J].情報科學,2016,34(2):139-143.

[13]王忠.大數(shù)據(jù)時代個人數(shù)據(jù)交易許可機制研究[J].理論月刊,2015(6):131-135.

[14]楊琪,龔南寧 .我國大數(shù)據(jù)交易的主要問題及建議[J].大數(shù)據(jù),2015(2):38-48.

篇(2)

關(guān)鍵詞:大數(shù)據(jù)背景;專業(yè)技術(shù);技能探究

中圖分類號:G64 文獻標識碼:A 文章編號:1009-3044(2016)33-0123-01

Abstract : With the theme of declare big data and applied technology major, this thesis was written by author from telecommunications engineering academy. It has researched and analysed the composition of big data, related technologies, application requirement about the data mining and the problems has been solved by big data technology; Also it described what kind of related knowledge and skills need to be master by higher vocation education students in school, analysed the teaching qualities contrast with the needs of modern enterprises in details, by all means this thesis will focus on practically personnel training and explore the thinking of vocational colleges’ big data application technology major.

Key words : big data background, professional technology, skills exploration

隨著網(wǎng)絡和數(shù)據(jù)信息科學的發(fā)展,數(shù)據(jù)在量和復雜度上的爆炸式增長讓人類進入了大數(shù)據(jù)時代。根據(jù)IDC監(jiān)測,人類產(chǎn)生的數(shù)據(jù)量正在成指數(shù)及增長,大約每兩年翻一番,以此速度在2020年之前會持續(xù)保持下去。大量數(shù)據(jù)源的出現(xiàn)則導致了非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)爆發(fā)式的增長即數(shù)據(jù)結(jié)構(gòu)日趨復雜。大數(shù)據(jù)分析意味著企業(yè)能夠從這些新的數(shù)據(jù)中獲取新的洞察力,并將其與已知I務細節(jié)相融合。大數(shù)據(jù)對各種行業(yè)似乎產(chǎn)生了前所未有的巨大影響,從制造商到旅游業(yè),從產(chǎn)品設計到消費者行為分析,大數(shù)據(jù)能提供前所未有的信息,幫助公商行業(yè)做出最好的決策。公商行業(yè)對合格的數(shù)據(jù)分析師或者數(shù)據(jù)工程師的需求很大。

人才市場需要會分數(shù)據(jù)并以有用的方式呈現(xiàn)信息的雇員。根據(jù)市場需求,高職院校需要培養(yǎng)學生成為具有數(shù)據(jù)應用技能的人才以滿足市場需求。我們研究方向是調(diào)查公司企業(yè)所需要的技能和大學教的數(shù)據(jù)分析技能,對比兩方面的技能的差別。人才需求調(diào)研裼昧宋示矸絞講杉專家的意,專家分為相關(guān)專業(yè)學科教授和企業(yè)內(nèi)本行業(yè)專家。

大數(shù)據(jù)應用技術(shù)專業(yè)的課程設置應跟隨新技術(shù)的應用,跟隨社會及企業(yè)需求,在新專業(yè)中重視培養(yǎng)專業(yè)技能和項目經(jīng)驗人才,課程設置應貼合社會需求培養(yǎng)相應的就業(yè)技能。需要研究關(guān)于合格的數(shù)據(jù)分析師或者數(shù)據(jù)工程師應該具有什么資格及知識技能。調(diào)研的結(jié)果可以幫助學院開設有關(guān)大數(shù)據(jù)學科的學校及大數(shù)據(jù)有關(guān)的課程教材。

調(diào)研內(nèi)容如下表格:

綜上所述,十報告?zhèn)鬟_的是要重視高等職業(yè)教育,強調(diào)“要全面實施素質(zhì)教育,深化教育領域綜合改革,著力提高教育質(zhì)量,培養(yǎng)學生創(chuàng)新精神?!敝袊穆毥腆w系也在深入發(fā)展改革的過程中。本調(diào)研是針對高等職業(yè)院校的大數(shù)據(jù)應用技術(shù)專業(yè)的課程設置的進行探究,通過對大數(shù)據(jù)應用技術(shù)專業(yè)在市場人才需求的研究,對全面實施素質(zhì)教育,重視學生的創(chuàng)新能力的培養(yǎng)具有重要意義。

參考文獻:

[1] 王星.大數(shù)據(jù)分析:方法與應用[M].清華大學出版社,2013.9.

[2] 曹正鳳.數(shù)據(jù)分析統(tǒng)計基礎[M].電子工業(yè)出版社,2015.2.

[3] 屈澤中.大數(shù)據(jù)時代數(shù)據(jù)分析[M].復旦大學出版社,電子工業(yè)出版社,2015.7.

[4] Hames R.Evans.Business Analytics:Methods,Models,and Decisions[M].電子工業(yè)出版社,2015.7

篇(3)

關(guān)鍵詞 大數(shù)據(jù);CiteSpace;教育

中圖分類號:G642 文獻標識碼:B

文章編號:1671-489X(2016)18-0069-03

Abstract The advent of the era of big data has brought new vitality

and challenges for educational research. This paper uses bibliometric visualization software Cite Space to analyze thesis with key words data and education from CNKI based on Co-occurrence analysis of keywords, explore the hot issues in the field of educational research, summarize the research status and trends.

Key words big data; CiteSpace; education

1 引言

近年來,教育領域研究者開始關(guān)注大數(shù)據(jù)背景下的教育管理模式轉(zhuǎn)變、教育決策研究等內(nèi)容,大量基于大數(shù)據(jù)背景的教育領域研究論文逐年增加。以“大數(shù)據(jù)”“教育”為主題關(guān)鍵詞在CNKI中國知網(wǎng)進行搜索,僅選擇SCI、EI、中文核心、CSSCI四類來源期刊截止到2015年12月出版的文獻,共檢索到417條數(shù)據(jù),從2010年開始呈現(xiàn)出逐年上升的趨勢。對這些文章進行瀏覽和篩選,選擇與本研究主題相關(guān)的論文,共247篇。對這247篇文章的關(guān)鍵詞信息進行研究,分析大數(shù)據(jù)的出現(xiàn)對教育領域研究熱點及發(fā)展趨勢的影響。

2 教育領域熱點問題研究知識圖譜

CiteSpace軟件是一款引文可視化分析軟件,著眼于分析科學知識中蘊含的潛在信息,通過可視化的手段呈現(xiàn)科學知識的結(jié)構(gòu)、規(guī)律和分布情況[1],能對文獻進行作者分析、關(guān)鍵詞共現(xiàn)分析、機構(gòu)分析、作者共被引分析、文獻共被引分析等。關(guān)鍵詞共現(xiàn)分析是一種內(nèi)容分析技術(shù),通過分析在同一個文本主題中的款目對(單詞或名詞短語對)共同出現(xiàn)的形式,確認文本所代表的學科領域中相關(guān)主題的關(guān)系,進而探索分析學科領域的發(fā)展,發(fā)現(xiàn)學科的研究熱點和研究趨勢[2]。

使用CiteSpace軟件對下載的文獻進行關(guān)鍵詞共現(xiàn)分析,生成圖1所示關(guān)鍵詞共現(xiàn)知識圖譜,分析大數(shù)據(jù)的出現(xiàn)對教育領域研究熱點和趨勢的影響。關(guān)鍵詞出現(xiàn)的頻次由圓圈代表的節(jié)點反映,圓圈越大,表明關(guān)鍵詞出現(xiàn)次數(shù)越多,最大圓圈代表的關(guān)鍵詞是“大數(shù)據(jù)”。

根據(jù)圖1得到表1所示文獻關(guān)鍵詞、被引頻次、中心性等指標數(shù)據(jù)。中心性代表共現(xiàn)程度的高低,中心性越強,表明該關(guān)鍵詞與其他關(guān)鍵詞共同出現(xiàn)的幾率就越大,也就表示該關(guān)鍵詞在共現(xiàn)網(wǎng)絡中的影響力越大。從知識理論角度分析,頻次和中心性高的關(guān)鍵詞一般是某一段時期內(nèi)研究者共同關(guān)注的問題,也就是研究的熱點和前沿。表1中,“大數(shù)據(jù)”是頻次最高也是中心性最高的關(guān)鍵詞;“學習分析”頻次為23,中心性為0.22;“數(shù)據(jù)挖掘”頻次為13,中心性為0.15,等等這些都是熱門的研究主題。

3 大數(shù)據(jù)背景下教育領域的熱點研究

依據(jù)圖1和表1所示結(jié)果,將大數(shù)據(jù)背景下教育領域的熱點研究總結(jié)為以下幾個方面。

學習分析和數(shù)據(jù)挖掘 教育數(shù)據(jù)挖掘是數(shù)據(jù)挖掘在教育領域的新型應用,主要目標為知識發(fā)現(xiàn)、決策支持和推薦等。學習分析是測量、搜集、分析和報告學生及其相關(guān)的學習環(huán)境的數(shù)據(jù),用以理解和優(yōu)化學習過程和學習環(huán)境[3]。

教育數(shù)據(jù)挖掘?qū)W⒂诩夹g(shù)層面,側(cè)重教育數(shù)據(jù)模型和模式的抽取,強調(diào)挖掘結(jié)果的自動化反饋;學習分析更注重研究有利于改善學習的干預措施。

2012年,美國教育部了報告《通過教育數(shù)據(jù)挖掘和學習分析促進教與學》[4],提出“數(shù)據(jù)驅(qū)動學校,分析變革教育”的大數(shù)據(jù)時代已經(jīng)來臨,要綜合運用教育數(shù)據(jù)挖掘和學習分析,構(gòu)建教育模型,探索教育變量,為教育教學提供有效支持。

在CNKI中以“學習分析”和“教育數(shù)據(jù)挖掘”為關(guān)鍵詞進行檢索,得到圖2所示的文獻數(shù)量趨勢圖。如圖2所示,2010年以前的文獻數(shù)量很少,但2010年之后開始呈指數(shù)式增長;2016年1―2月份刊登的相關(guān)主題期刊論文已有5篇,可以預計本年度,學習分析和數(shù)據(jù)挖掘仍將是大數(shù)據(jù)背景下教育領域的研究重點和熱點之一。

在線教育――興起與變革 以“在線教育”和“大數(shù)據(jù)”為關(guān)鍵詞進行搜索,得到圖3所示文獻數(shù)量趨勢圖。目前在線學習的發(fā)展趨勢主要有如下表現(xiàn)。

1)移動學習是大方向:隨著無線網(wǎng)絡的覆蓋,移動終端特別是手機用戶的增多,移動學習逐漸發(fā)展起來。

2)免費是大趨勢:目前在線學習存在各式各樣的免費現(xiàn)象,如免費試用、前期付費后期免費等形式。

3)細化管理是要求:任何一種在線學習方式,都離不開資源開發(fā)、管理和優(yōu)化等工作,需要設定管理要求,細化規(guī)則。

4)實現(xiàn)互動是必然:交互功能是在線學習軟件必然要設計的功能,大多數(shù)在線學習使用者表示學習過程中希望能有更多的互動交流。

5)個性化學習是亮點:學習分析和教育數(shù)據(jù)挖掘的出現(xiàn),使得在線學習存儲的大量數(shù)據(jù)能夠被更快速分析和使用,學習者可以隨時掌握學習狀況,開發(fā)商也可以掌握學習者的興趣點、學習特征等,為學習者推薦或制訂個性化的學習方案。

教育信息化 我國的教育信息化主要包含兩層含義:一是把提高信息素養(yǎng)納入教育目標,培養(yǎng)適應信息社會的人才;二是把信息技術(shù)手段有效應用于教育,注重教育信息資源的開發(fā)與利用。教育信息化的核心是教學信息化,要求在教育過程中較全面地運用現(xiàn)代信息技術(shù),促進教育改革,適應信息化社會提出的新要求,深化教育改革,實施素質(zhì)教育。隨著大數(shù)據(jù)時代的來臨,教育信息化也在不斷進步,未來的教育信息化將在教育云平臺上進行展現(xiàn),現(xiàn)有的教育網(wǎng)、校園網(wǎng)將全面升級,實現(xiàn)互聯(lián)網(wǎng)、電信網(wǎng)、廣電網(wǎng)等跨平臺使用并支持移動設備。

在CNKI中以“教育信息化”和“大數(shù)據(jù)”為關(guān)鍵詞進行檢索,2013年共有3篇學術(shù)論文,2015年共有10篇,研究主題包括大數(shù)據(jù)時代的信息化教學、教師培訓、課程資源建設、教育輿情監(jiān)控等。

教育決策 以“教育決策”為關(guān)鍵詞搜索到上千篇學術(shù)論文,以“教育決策”和“大數(shù)據(jù)”為關(guān)鍵詞,2013年以來共有8篇論文。大數(shù)據(jù)將在教育決策中發(fā)揮越來越重要的作用已成為共識,但如何利用大數(shù)據(jù)進行決策是目前面臨的難題,如何解決這個難題也是研究者重點關(guān)注的領域。教育決策離不開數(shù)據(jù),大數(shù)據(jù)背景下的數(shù)據(jù)更加復雜、凌亂,呈現(xiàn)碎片化的特征,并且摻雜一些虛假數(shù)據(jù),如何收集、選擇數(shù)據(jù),是第一步需要做的事情。大數(shù)據(jù)對于教育決策的價值在于為教育服務,將數(shù)據(jù)轉(zhuǎn)化為支持決策的信息,需要數(shù)據(jù)分析者具備綜合、全面的數(shù)據(jù)分析素質(zhì)和能力。大數(shù)據(jù)的核心是預測,隨著教育信息化和在線學習的持續(xù)發(fā)展,數(shù)據(jù)呈爆炸式增長,需要對數(shù)據(jù)進行整合、分析,發(fā)現(xiàn)新知識,為教育優(yōu)化服務。

4 數(shù)據(jù)推動決策

傳統(tǒng)決策過程主要依靠決策者的經(jīng)驗,主觀性較強,或多或少存在一些不足,難以充分發(fā)現(xiàn)教育過程中的潛在問題,無法真正有效地優(yōu)化教學、提高學生表現(xiàn)。信息化推動了人類發(fā)展,逐漸成為人類生活必不可少的重要部分;信息化技術(shù)普及的同時,也產(chǎn)生前所未有的海量數(shù)據(jù)。大數(shù)據(jù)時代的來臨,顛覆了傳統(tǒng)數(shù)據(jù)分析方法;大數(shù)據(jù)背景

下,利用數(shù)據(jù)挖掘方法發(fā)現(xiàn)問題、支持決策具有多方面的意義。

1)優(yōu)化教學、提高教育質(zhì)量。教師若能充分利用學生學習數(shù)據(jù),分析學生學習過程,可以更加快速、便捷、有效地了解學生,發(fā)現(xiàn)不足之處并及時反饋,提供改進意見等[5]。

2)為學校管理者制訂更加合理的教學計劃和方案提供決策支持。基于數(shù)據(jù)的教育決策能夠為管理者提供更加準確、合理的決策支持?;跀?shù)據(jù)的教育決策能夠提供從數(shù)據(jù)到?jīng)Q策,實施決策后產(chǎn)生的數(shù)據(jù)再到?jīng)Q策的一種良性循環(huán)過程[6]。

3)幫助地區(qū)甚至是國家級決策者進行科學判斷。數(shù)據(jù)推動決策具有相當明顯的優(yōu)勢,能為決策者提供全方位的視角。大數(shù)據(jù)分析得到的結(jié)果具有全面性、多視角性、參考性強等特點,能夠更好地為決策者提供決策支持。

5 結(jié)語

上文所分析出的教育領域熱點研究問題,都緊緊圍繞“數(shù)據(jù)推動決策”這一主題,學習分析和教育挖掘是分析方法和技術(shù);在線教育是數(shù)據(jù)來源;教育信息化是信息化大數(shù)據(jù)環(huán)境;教育決策則是根據(jù)數(shù)據(jù)制定決策并運用于教育教學??梢?,利用數(shù)據(jù)推動決策已成為教育領域在大數(shù)據(jù)背景下最為重要的研究問題之一。

參考文獻

[1]陳悅,陳超美,胡志剛.引文空間分析原理與應用:Cite Space實用指南[M].北京:科學出版社,2014.

[2]潘黎,王素.近十年來教育研究的熱點領域和前沿主題:基于八種教育學期刊2000-2009年刊載文獻關(guān)鍵詞共現(xiàn)知識圖譜的計量分析[J].教育研究,2011(2):47-53.

[3]Siemens G. Learning and Knowledge Analytics-Knewton-the future of education?[EB/OL].[2011-04-17].http:///?p=126.

[4]Enhancing Teaching and Learning through Educational Data Mining and Learning Analytics[DB/OL].[2012-10-12].http://ed.gov/edblogs/technology/files/2012/03/edm-la-brief.pdf.

篇(4)

關(guān)鍵詞:大數(shù)據(jù)時代 數(shù)字圖書館 機遇與挑戰(zhàn)

中圖分類號:G25 文獻標識碼:A 文章編號:1672-3791(2016)10(b)-0150-02

在科學技術(shù)的影響下,學術(shù)資源建設速度越來越快。例如:中國最大的學術(shù)資源建設商――中國知網(wǎng),已經(jīng)從期刊論文向國內(nèi)外期刊論文發(fā)展,在圖書資源收藏方面收集了大量資源,可以給行業(yè)機構(gòu)、學術(shù)等提供大量文獻。在此種發(fā)展形式下,數(shù)字圖書館承受了較大壓力,如何在未來發(fā)展中更好生存,已經(jīng)成為人員研究的主要問題,必須及時對其進行分析。

1 國內(nèi)外研究與啟示

1.1 國內(nèi)外相關(guān)論述對我國的影響

隨著大數(shù)據(jù)時代的到來,人們對數(shù)據(jù)的需求量不斷增大。目前國外相關(guān)研究已經(jīng)從理念、技術(shù)和數(shù)據(jù)等方面進行了很多研究。美國加州大學伯克利分校圖書館的Huwe在《構(gòu)建數(shù)字D書館》一書中明確指出,大數(shù)據(jù)與數(shù)字化圖書館的發(fā)展方向吻合,可以借助數(shù)字圖書館進行信息采集和收集,進而挖掘用戶行為,幫助人們了解閱讀行為與信息的聯(lián)系。Borgman等人將嵌入式技術(shù)成功安裝于數(shù)字圖書館系統(tǒng)中,增加了數(shù)字圖書館功能,可以實現(xiàn)圖書分類、收集處理和關(guān)聯(lián)等各項操作,促進了數(shù)字圖書館與網(wǎng)絡技術(shù)的融合,發(fā)揮了大數(shù)據(jù)的作用。

國內(nèi)研究人員曾建勛曾在《數(shù)字圖書館論壇》中明確指出,大數(shù)據(jù)時代將數(shù)據(jù)數(shù)字圖書館數(shù)據(jù)管理、收集等服務的深層次發(fā)展,對數(shù)字圖書館人員提出了較高要求。另外武漢大學生陳傳夫等也從理念、發(fā)展知識和財政投入機制等,分析了圖書館素質(zhì)等問題,并提出了相關(guān)應對措施。

從上述研究均可看出大數(shù)據(jù)對數(shù)字圖書館帶來的發(fā)展機遇和挑戰(zhàn),促進了數(shù)字圖書館和大數(shù)據(jù)的融合。為了促進高校圖書館和我國公共圖書館在大數(shù)據(jù)時代的發(fā)展,發(fā)揮數(shù)字圖書館在人們的生活或科學研究中的作用,必須深入思考,及時轉(zhuǎn)變觀念,提高數(shù)字圖書館的競爭力。

1.2 啟示與思考

從當前的發(fā)展狀況來看,學術(shù)資源建設商已經(jīng)在大數(shù)據(jù)時代取得了很大進展,不僅包含網(wǎng)絡資源與期刊,還涉及各種文獻資源,可以查找作者、文獻關(guān)系與學者等關(guān)系,給數(shù)字圖書館的發(fā)展帶來了很大壓力。所以圖書館相關(guān)人員必須提高思想認識,將資源建設商帶來的威脅作為新的機遇。在實際工作中,必須積極吸取圖書館建設資源,擴展圖書館資源范疇,進行各種資源的有機結(jié)合,同時還要充分發(fā)揮資源價值,促使各種資源的整合,深入挖掘數(shù)據(jù)規(guī)律,認真分析數(shù)據(jù)規(guī)律,發(fā)現(xiàn)數(shù)據(jù)潛在價值。從服務角度上分析,圖書館還要向眾多資源建設商學習,從用戶角度探索問題,給用戶提供人性化服務,滿足用戶對資源的需求。

經(jīng)過分析發(fā)現(xiàn),大數(shù)據(jù)時代,必須要改變傳統(tǒng)的思維模式,形成適合數(shù)字圖書館發(fā)展的模式,適應大數(shù)據(jù)時代的發(fā)展,充分利用大數(shù)據(jù)促進數(shù)字圖書館的發(fā)展,讓數(shù)字圖書館在人們的生活、學習和工作中發(fā)揮更大作用。

2 淺析數(shù)字圖書館的大數(shù)據(jù)思維

數(shù)字圖書館的大數(shù)據(jù)思維主要表示從大數(shù)據(jù)角度思考并分析數(shù)字圖書館發(fā)展中存在的問題,實現(xiàn)數(shù)字圖書館和大數(shù)據(jù)時代的有機融合,增加數(shù)字圖書館產(chǎn)品種類,提高數(shù)字圖書館服務水平。

2.1 建設數(shù)字圖書館資源

第一,擴大數(shù)字圖書館資源范圍。資源是數(shù)字圖書館發(fā)展的基礎,也是提高數(shù)字圖書館服務質(zhì)量的主要方法。在長期發(fā)展中,圖書館非常重視資源建設,主要是圖書、期刊及學位論文等資源。為了在大數(shù)據(jù)時代下發(fā)展,必須創(chuàng)新思維,引入一些數(shù)據(jù)庫資源或一些社會熱點信息等內(nèi)容,以用戶的搜索習慣作為數(shù)字圖書采集參考,深入挖掘各種數(shù)據(jù)之間的聯(lián)系,實現(xiàn)可再生資源的生產(chǎn)、收集和儲存,擴大數(shù)字圖書資源范圍。第二,提高數(shù)字圖書館資源整合度。大數(shù)據(jù)時代的主要特點是數(shù)據(jù)類型較復雜,單純的文本信息已經(jīng)不能被大數(shù)據(jù)時展用戶吸取,可以實現(xiàn)資源整合向綜合信息服務轉(zhuǎn)變。為了滿足不同用戶的需求,還可以實現(xiàn)文獻和政府等信息的整合,擴大社會資源和數(shù)字圖書館的聯(lián)系,將公眾最關(guān)注的問題引入到社會資源整合中。第三,加強數(shù)字圖書館資源加工深度。在大數(shù)據(jù)時代,雖然數(shù)字圖書館結(jié)構(gòu)信息具有較強的表現(xiàn)形式,但主要體現(xiàn)在資源庫內(nèi)部。在大數(shù)據(jù)時代下,必須及時擴展數(shù)字資源和外界的聯(lián)系,構(gòu)建全社會數(shù)字圖書館資源架構(gòu)。同時進行圖書館資源深度加工時,必須從知識結(jié)構(gòu)向知識建構(gòu)加工方向發(fā)展。例如:從圖書館文獻資源中分析知識結(jié)構(gòu),利用知識單位和文獻建立知識建構(gòu),形成新知識。

2.2 靈活應用數(shù)字圖書館技術(shù)

大數(shù)據(jù)時代,數(shù)字圖書館技術(shù)已經(jīng)開始從處理局部數(shù)據(jù)向更廣的區(qū)域發(fā)展。從圖書館技術(shù)體系分析主要進行信息處理、組織架構(gòu)、分析預測、服務技術(shù)等操作。

第一,應用語義技術(shù)。大數(shù)據(jù)環(huán)境中可以采用語義實現(xiàn)復雜數(shù)據(jù)的聯(lián)系。當前數(shù)字圖書面臨的主要問題是將語義加入數(shù)字文獻信息中。所以必須將本體技術(shù)、人工智能等先進技術(shù)應用到實際工作中,讓數(shù)據(jù)間形成語義關(guān)系,促進收錄資源和知識挖掘等各項操作。目前語義技術(shù)已經(jīng)廣泛應用到圖書領域中,如:漢語主題詞表、圖書分類法等均是依靠語義發(fā)展起來的。知識相互間的語義關(guān)系,不僅可以幫助用戶及時獲取知識,還可以獲得有用知識途徑。第二, 數(shù)據(jù)聚類技術(shù)。數(shù)據(jù)聚類是實現(xiàn)信息相互聚集的過程。在繁雜的數(shù)據(jù)中,只有靈活應用聚類技術(shù),才能發(fā)揮信息服務、處理等各種功能。在大數(shù)據(jù)背景下,利用數(shù)據(jù)聚類可將不同數(shù)據(jù)劃分成相互聯(lián)系、主體相近的小數(shù)據(jù),給用戶信息檢索、選擇和分析提供很大方便,給用戶個性化服務提供了數(shù)據(jù)支持。第三,信息分析技術(shù)。大數(shù)據(jù)時代可以充分利用信息分析技術(shù)。可以將大數(shù)據(jù)技術(shù)融入到書籍圖書館中,拓展了數(shù)據(jù)分析工作,給用戶提供了高端服務。例如:聯(lián)機分析技術(shù)可給在線用戶提供數(shù)據(jù)支持;定量定性分析技術(shù)可以在數(shù)字圖書館中得到充分應用。

2.3 數(shù)字圖書館的定位

第一,打破傳統(tǒng)資源框架束縛。大數(shù)據(jù)給圖書館提供了較廣闊的發(fā)展空間,滿足了用戶對不同信息的需求,在信息采集、收集和服務等方面均發(fā)生了變化。數(shù)字圖書館進行定位時,必須打破傳統(tǒng)資源框架,將數(shù)據(jù)理念融于到數(shù)字圖書館建設中,所以不僅要采用傳統(tǒng)的方法進行信息采集,還要進行網(wǎng)絡信息自動獲取,構(gòu)建語義關(guān)系、數(shù)據(jù)聯(lián)系等信息組織框架。

第二,建立全方位服務信息。傳統(tǒng)圖書館主要進行文獻服務。數(shù)字化圖書館服務資源發(fā)生了變化,服務形式開始從被動化向主動化發(fā)展。一方面向全社會提供服務;另一方面,提供全新資源服務;最后不斷擴展服務與傳播方式,全面擴展數(shù)字圖書館服務。

第三,定位數(shù)字圖書館員。大數(shù)據(jù)時代對圖書館員提出了更高要求,每館員都要有敏銳的數(shù)據(jù)分析能力;及時了解學術(shù)變化;掌握大數(shù)據(jù)分析技術(shù);熟練使用各種數(shù)據(jù)分析工具和軟件,準確定位網(wǎng)絡資源,促進數(shù)字圖書館的發(fā)展。

3 結(jié)語

大數(shù)據(jù)時代給數(shù)字圖書館帶來了挑戰(zhàn),是數(shù)字圖書館的一種巨大轉(zhuǎn)型,可以擴展數(shù)字圖書館數(shù)據(jù)資源,提高數(shù)字圖書館服務功能;同時,還要不斷思考資源框架、技術(shù)應用模式和服務功能,與廣大學術(shù)資源建設商共同發(fā)展。

參考文獻

篇(5)

Abstract The arrival of the era of big data endows the library with new service content and requirements. In the aspect of open data services, libraries need to switch roles, and to provide users with collections catalog, data governance,open access, knowledge discovery, semantic analysis and other services.

Keywords big data;open data;library service;knowledge discovery;information organization

大數(shù)據(jù)帶來的信息風暴正在變革人類的生活、工作和思維[1]。在大數(shù)據(jù)時代,滲透到各個行業(yè)、領域的數(shù)據(jù)成為了推動社會發(fā)展的要素之一,因此有人稱大數(shù)據(jù)時代的數(shù)據(jù)就是“金礦”。但這種“金礦”的價值挖掘與實現(xiàn)需要借助相應的技術(shù)與平臺,也需要人類智慧的參與,于是,對大數(shù)據(jù)資源的高效利用成為了相關(guān)業(yè)界如IT、企業(yè)、科研等普遍關(guān)注的問題。以信息組織、信息利用為所長的圖書館,也感受到了大數(shù)據(jù)時代所帶來的變化,在近年來也展開了大量的圖書館視野下的相關(guān)理論研究。

大數(shù)據(jù)帶給圖書館的影響與變化主要是數(shù)據(jù)的變化,即圖書館從面對傳統(tǒng)的有序、單一、少量的結(jié)構(gòu)化數(shù)據(jù)如數(shù)據(jù)庫數(shù)據(jù)向無序、多元、海量的非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)方向轉(zhuǎn)移。其中,作為大數(shù)據(jù)組成部分、集合了理念與實踐的開放數(shù)據(jù)(Open Data)也受到了關(guān)注與研究。本文在概述大數(shù)據(jù)與開放數(shù)據(jù)的基礎上,對開放數(shù)據(jù)視角下的圖書館角色進行了審視與分析,最后對大數(shù)據(jù)時代開放數(shù)據(jù)環(huán)境下的圖書館創(chuàng)新服務如數(shù)據(jù)監(jiān)管、知識發(fā)現(xiàn)等服務進行了列舉和概述。

1 大數(shù)據(jù)與開放數(shù)據(jù)概述

1.1 大數(shù)據(jù)

目前,業(yè)界對大數(shù)據(jù)還沒有一個明確的定義,但也一般都認為大數(shù)據(jù)是不可能用常規(guī)軟件和分析工具進行分析的巨大數(shù)據(jù)集[2]。此外,大數(shù)據(jù)既有結(jié)構(gòu)化數(shù)據(jù),也有非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),涵蓋了文本、數(shù)字、圖像、視頻等多種類型,并可跨越多個數(shù)據(jù)平臺,如社交媒體網(wǎng)絡、網(wǎng)絡日志文件、傳感器、智能手機的定位數(shù)據(jù)、數(shù)字化文檔及歸檔的照片和視頻等[3]。

1.2 開放數(shù)據(jù)

互聯(lián)網(wǎng)與開放獲?。∣pen Access,OA)運動的發(fā)展,既使得人們的信息交流更加便捷與方便,也讓對開源和開放知識、數(shù)據(jù)、資源的利用逐漸成為人們獲取信息的主要組成部分。由此而產(chǎn)生的自由開放思維也成了人們信息獲取的主要思維,總是期待著出現(xiàn)解決不局限于軟件、開放格式和數(shù)據(jù)自由公開與再使用的開放信息,于是一種實現(xiàn)了更廣范圍的公開與再使用數(shù)據(jù)即開放數(shù)據(jù)便應運而生。

對開放數(shù)據(jù)的定義存在爭論,不同的組織、機構(gòu)也存在不同的理解視角,但對于開放數(shù)據(jù)的內(nèi)涵即其是一種理念及實踐、數(shù)據(jù)不受版權(quán)與專利等機制限制、可以被任何人自由獲取還是都能接受與認可。有學者也曾對開放數(shù)據(jù)的內(nèi)涵闡釋為:按照用戶特定的需求和一定的互聯(lián)網(wǎng)協(xié)議、規(guī)則、框架,對Web數(shù)據(jù)進行存儲和組織的活動,而利用的數(shù)據(jù)來自不同的數(shù)據(jù)源或是不同的數(shù)據(jù)類型,最終目標是實現(xiàn)信息在網(wǎng)絡空間的開放、共享與重用,以尋求信息數(shù)據(jù)最大可能的無限獲取與重用[4]。

開放數(shù)據(jù)與一般的數(shù)據(jù)相比,其最大的特征就是數(shù)據(jù)集增值方式,即對象數(shù)據(jù)包含了所有的事實、數(shù)據(jù)、信息乃至智慧和知識,也不如其它傳統(tǒng)數(shù)據(jù)可以直接獲取、利用和分析,依賴于見證者而存在,不是我們接受或不接受的數(shù)據(jù)或其它,是我們給予、分享和接受的記憶[5]。同時,開放數(shù)據(jù)還具有開放性增值方式,因而在用戶多、普及率高的政府網(wǎng)站及公共信息服務、商業(yè)應用等領域應用廣泛,目前,英、美、澳等政府和淘寶等商業(yè)組織都應用開放數(shù)據(jù)進行信息公開等服務,以增強與公眾、用戶之間的交流與互信。

2 基于開放數(shù)據(jù)視角的圖書館角色審視與定位

在開放數(shù)據(jù)的具體實踐如開放存取運動、開放研究出版、科學家電子實驗筆記開放及科學知識的出版與交流等形式中,圖書館都是各個實踐形式的主要參與者與推行者,但由于開放數(shù)據(jù)運動目前在各國的實踐主體主要是政府,并且世界主要發(fā)達國家如美國、英國、法國等也均承諾政府將把公眾的需求放在重要位置,通過征求公眾意見逐步開放有價值的數(shù)據(jù)集,體現(xiàn)了政府在開放數(shù)據(jù)運動中的絕對推動者、踐行者地位。在這種環(huán)境下,圖書館必須準確定位自己的角色,發(fā)揮自身優(yōu)勢為開放數(shù)據(jù)的發(fā)展提供服務,如基于開放數(shù)據(jù)的館藏目錄、開放獲取等。

Hope Leman認為在開放數(shù)據(jù)運動中,圖書館員是知識工具箱與支持專家,即實現(xiàn)對概念的知識注釋、實驗及相關(guān)技術(shù)研發(fā)的知識支持[6]。我國學者劉春麗、徐躍權(quán)則認為在開放數(shù)據(jù)環(huán)境中,圖書館可能扮演與研究周期各個階段的科學產(chǎn)出匹配的知識服務中心和開放數(shù)據(jù)的管理和保存中心兩大角色[7]。

(1)知識服務中心。隨著科學研究的周期不同,圖書館在科研過程中所發(fā)揮的作用和提供的服務也隨之不同,如在科學研究的概念階段,圖書館可為進行科學理念、研究計劃討論的用戶提供開放書目等服務,并將討論結(jié)果等形成新的知識分享數(shù)據(jù);在數(shù)據(jù)分析與出版階段,圖書館可借助于在開放存取期刊發(fā)表、提交到機構(gòu)知識庫中等途徑將科學研究的結(jié)論、實驗數(shù)據(jù)、科研過程等進行開放獲取與共享交流;在同行評審階段,圖書館可以發(fā)揮科研情報中心的作用,基于學術(shù)社交網(wǎng)絡及開放存取平臺,分析科學研究論文與數(shù)據(jù)的使用與評價活動,提取基于使用與評價的選擇性計量指標(Altmetrics),對科學論文和科學數(shù)據(jù)的科學價值進行評價,進而評估論文與作者在某一個研究領域的學術(shù)影響力[7]。

(2)開放數(shù)據(jù)的管理與保存中心。歐洲研究圖書館協(xié)會主席Paul Ayris博士認為在科學研究的開放工作流中,要增加專業(yè)圖書館的可見度,要重視科學數(shù)據(jù)的再利用及科學數(shù)據(jù)保存的可持續(xù)性[8]。筆者以為在以數(shù)據(jù)密集型為科學研究特征的第四代科研范式下,數(shù)據(jù)特別是產(chǎn)生于實驗、記錄了科研過程等重要信息的科學數(shù)據(jù)是科學研究所重視和再利用的數(shù)據(jù)對象,圖書館有責任與義務扮演開放數(shù)據(jù)管理與中心的角色,以為科學家等用戶群體提供開放數(shù)據(jù)的檢索、分析、保存等服務?;陂_放數(shù)據(jù)的連續(xù)利用視角,圖書館還需進行諸如開放數(shù)據(jù)的關(guān)聯(lián)與、標示與引用等服務。

3 大數(shù)據(jù)時代的圖書館開放數(shù)據(jù)服務

大數(shù)據(jù)帶給社會以數(shù)據(jù)驅(qū)動的社會創(chuàng)新與發(fā)展動力,因此如美國總統(tǒng)科學技術(shù)顧問委員會給總統(tǒng)和國會的報告所說“聯(lián)邦政府的每一個機構(gòu)和部門,都要制定一個應對大數(shù)據(jù)的戰(zhàn)略”[9]一樣,包括政府在內(nèi)的社會各個機構(gòu)如美國政府、歐盟等都制定了應對大數(shù)據(jù)的戰(zhàn)略對策。2010年11月,歐盟通信委員會向歐洲議會提交了“開放數(shù)據(jù): 創(chuàng)新、增長和透明治理的引擎”報告[10],首次將開放數(shù)據(jù)與大數(shù)據(jù)關(guān)聯(lián)到了一起,并以開放數(shù)據(jù)為核心,對大數(shù)據(jù)時代的挑戰(zhàn)進行了戰(zhàn)略部署。但將大數(shù)據(jù)概念應用到開放數(shù)據(jù)上,則首先意味著數(shù)據(jù)的規(guī)模和類型有了變化,產(chǎn)生于社交媒體、智能終端、傳感器上的海量非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)都是開放數(shù)據(jù)的范疇;其次,意味著數(shù)據(jù)的應用發(fā)生了變化,即數(shù)據(jù)不再是單一領域的數(shù)據(jù),而是覆蓋了用戶的所有需求領域,并可直接獲取和應用。

大數(shù)據(jù)賦予開放數(shù)據(jù)的新要求也意味著大數(shù)據(jù)時代的圖書館開放數(shù)據(jù)服務將被賦予新的要求,筆者認為,大數(shù)據(jù)時代的圖書館開放數(shù)據(jù)服務,主要有:

(1)多領域數(shù)據(jù)源的整合與開放服務。從目前的開放數(shù)據(jù)運動發(fā)展來看,主要實踐有開放政府數(shù)據(jù)、開放存取學術(shù)期刊與機構(gòu)知識庫,距大數(shù)據(jù)時代所要求的多類型、多領域發(fā)展程度要求尚遠。圖書館由于有著涵蓋了所有領域的豐富館藏資源,是大數(shù)據(jù)時代數(shù)據(jù)開放與整合的最佳實踐者。因此,圖書館可整合多方資源,如科技、人文、氣象、政務等諸多領域的報告、實驗數(shù)據(jù)等資源,進行數(shù)據(jù)的整合與開放,讓公眾通過圖書館的一站式檢索服務平臺來獲取所需的數(shù)據(jù)。

(2)基于知識聯(lián)盟的數(shù)據(jù)開放與共享服務。由于大數(shù)據(jù)時代的開放數(shù)據(jù)是整合了不同系統(tǒng)、政府和部門之間的數(shù)據(jù)集,這就需要建立一個數(shù)據(jù)共享和互操作的框架,如新澤西州運輸部利用采集到的數(shù)據(jù)(在汽車制造商的管轄下)能夠發(fā)現(xiàn)諸如擁堵和交通流等問題,而這些功能通常是由當?shù)鼗蛉珖恼煌ㄟ\輸部門負責[11]。圖書館可借鑒這些成功的案例進行構(gòu)建或參與到由政府、企業(yè)、社會機構(gòu)組成的知識聯(lián)盟,利用協(xié)作分析技術(shù)對數(shù)據(jù)和系統(tǒng)進行無縫隙整合。

(3)基于一站式服務平臺的知識發(fā)現(xiàn)服務。數(shù)據(jù)“開放”的核心是為了用戶更高效的發(fā)現(xiàn)和利用,以縮小信息所有者和用戶的信息不對稱距離。EDS、PRIMO、SUMMON等一站式知識發(fā)現(xiàn)平臺的應用為圖書館的開放數(shù)據(jù)知識發(fā)現(xiàn)服務提供了方便,圖書館可應用這些平臺對用戶提供知識咨詢等服務。

(4)數(shù)據(jù)的開發(fā)、創(chuàng)建、共享與轉(zhuǎn)換服務。此類服務在圖書館界已有著成功的實踐,如開源站點biblios.net采用了類似維基模式向圖書館界提供開放MARC數(shù)據(jù)的開發(fā)、創(chuàng)建、共享、轉(zhuǎn)換服務,目前以3000萬余條數(shù)據(jù)成為為全球最大的免費圖書館編目數(shù)據(jù)平臺[12],德國國家圖書館[13]、大英圖書館[14]也宣布對外提供開放數(shù)據(jù)服務。

(5)數(shù)據(jù)監(jiān)管服務。開放數(shù)據(jù)的檢索、價值挖掘與應用實現(xiàn),必須經(jīng)過一定的排列、存檔與管理過程,而這些數(shù)據(jù)有可能是來自于有數(shù)據(jù)組織經(jīng)驗和能力的政府、企業(yè)、公益組織等,也可能是來自于只提供數(shù)據(jù)而沒有數(shù)據(jù)組織或沒有組織意愿的公眾、機構(gòu)。圖書館可發(fā)揮自身的信息組織、信息分類特長,對這些數(shù)據(jù)進行修改、合并、標引、分析與索引,即提供數(shù)據(jù)監(jiān)管服務,使數(shù)據(jù)集合之后獲取最大收益。

篇(6)

關(guān)鍵詞:大數(shù)據(jù); 湖南??;綠色大數(shù)據(jù)港灣;戰(zhàn)略對策

0 引言

隨著信息技術(shù)網(wǎng)絡化、泛在化、智能化的發(fā)展,人機物三元世界開始深度融合。大數(shù)據(jù)將有力支撐教育、文化、健康、電子商務、制造等產(chǎn)業(yè)以及在線服務、社會管理等行業(yè),解決未來信息社會結(jié)構(gòu)下生產(chǎn)力發(fā)展的重大瓶頸問題;有助于解決交通出行、醫(yī)療衛(wèi)生、應急搶險、人口教育等各類社會發(fā)展問題,大幅提升民生領域的智能化程度和服務水平。如果能有效地篩選和使用大數(shù)據(jù),將有效為地方經(jīng)濟、科學研究、社會治理等方面積極服務。因此加快大數(shù)據(jù)開發(fā)利用,一方面有利于促進產(chǎn)業(yè)轉(zhuǎn)型,提升社會活力、促進經(jīng)濟增長和提高生產(chǎn)效率,另一方面也有利于攻破體制機制障礙,推進依法行政和促進政府職能轉(zhuǎn)變,提升國家綜合實力,保障社會安全。

1 構(gòu)筑湖南省大數(shù)據(jù)港灣的戰(zhàn)略目標

開展若干面向重點區(qū)域與行業(yè)的大數(shù)據(jù)示范應用,建設科學研究、電子政務、智能制造、公共安全、醫(yī)療衛(wèi)生、文化教育、互聯(lián)網(wǎng)服務、城市管理、社會公共服務等領域的大數(shù)據(jù)應用,為湖南省經(jīng)濟社會發(fā)展提供大數(shù)據(jù)科技支撐保障,加快湖南省大數(shù)據(jù)分析應用的產(chǎn)業(yè)化布局,服務湖南省經(jīng)濟社會建設,促進經(jīng)濟結(jié)構(gòu)調(diào)整和產(chǎn)業(yè)轉(zhuǎn)型。促進行業(yè)融合發(fā)展、推動產(chǎn)業(yè)轉(zhuǎn)型升級、助力智慧城市建設。

2 構(gòu)筑湖南省大數(shù)據(jù)港灣的戰(zhàn)略措施

通過對大數(shù)據(jù)發(fā)展趨勢的研究,預測大數(shù)據(jù)對經(jīng)濟、政府與社會運行所帶來的影響,制定五年或十年的發(fā)展規(guī)劃,協(xié)同政府各部門、各行業(yè)主管單位、企事業(yè)單位及個人各方面力量出謀劃策、發(fā)揮聚合效用,促進可持續(xù)共同發(fā)展。其戰(zhàn)略重點主要集中在以下幾個方面:

2.1 突破大數(shù)據(jù)的關(guān)鍵技術(shù)

建設開放共享的大數(shù)據(jù)分析平臺,發(fā)展大數(shù)據(jù)條件下的類人視覺和類人思維決策計算模型,突破類人視覺技術(shù),研究基于深度神經(jīng)網(wǎng)絡的圖像視頻中目標檢測、跟蹤、分類以及行為和事件識別,研制類人視覺傳感器,構(gòu)建類人智能計算和理解的核心系統(tǒng),為相關(guān)產(chǎn)業(yè)提供實時智能服務。突破互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和廣電網(wǎng)視覺大數(shù)據(jù)中視覺場景理解、多目標檢測跟蹤、人員身份識別、視頻信息檢索、大范圍安全監(jiān)控等關(guān)鍵技術(shù),面向公共安全等重大需求提供透明時空示范應用。

2.2 加快大數(shù)據(jù)基礎設施建設

當前,大數(shù)據(jù)相關(guān)的基礎軟硬件設施、分析方法、領域應用及數(shù)據(jù)生產(chǎn)等方面已經(jīng)形成了一批企業(yè)和技術(shù)系統(tǒng),大數(shù)據(jù)產(chǎn)業(yè)生態(tài)系統(tǒng)的雛形已經(jīng)明確。大數(shù)據(jù)產(chǎn)業(yè)生態(tài)系統(tǒng)涵蓋了大數(shù)據(jù)的獲取、存儲、處理、分析、服務、安全等諸多環(huán)節(jié),并逐步與傳統(tǒng)產(chǎn)業(yè)結(jié)合釋放出巨大的生命力。重點推進信息產(chǎn)業(yè)園、軟件園等園區(qū)開展大數(shù)據(jù)基地建設,加快建成湖南數(shù)據(jù)中心,支持建O金融機構(gòu)和企業(yè)數(shù)據(jù)中心及嘗試縣級大數(shù)據(jù)應用服務園區(qū)。吸引國內(nèi)外知名大數(shù)據(jù)龍頭企業(yè),創(chuàng)新研發(fā)平臺,突破大數(shù)據(jù)關(guān)鍵技術(shù),培育新興業(yè)態(tài)領域。

2.3 重視大數(shù)據(jù)人才培養(yǎng)

為培養(yǎng)我省大數(shù)據(jù)技術(shù)研發(fā)、服務咨詢、市場推廣等應用型人才,應加大鼓勵高校與行業(yè)企業(yè)、科研院所深度合作,支持大數(shù)據(jù)企業(yè)與高校建立生產(chǎn)性實訓教學基地,建立院士工作站和博士后工作站,協(xié)同創(chuàng)新我省與大數(shù)據(jù)知名專家學者長效科技人才培養(yǎng)機制,為我省大數(shù)據(jù)產(chǎn)業(yè)發(fā)展提供人才支撐與智力支持。

2.4 啟動大數(shù)據(jù)產(chǎn)業(yè)試點

面向國計民生重大需求,重點選取教育、健康、公共安全、醫(yī)療衛(wèi)生、金融證券、智能制造、智能交通等具有大數(shù)據(jù)基礎的領域,集成大數(shù)據(jù)基礎理論、類腦智能、視覺語音文本大數(shù)據(jù)分析、多源異構(gòu)數(shù)據(jù)融合的研究成果,探索大數(shù)據(jù)分析應用的創(chuàng)新服務模式,在特定領域發(fā)展多源感知網(wǎng)絡(物聯(lián)網(wǎng)、互聯(lián)網(wǎng)、電信網(wǎng)、廣電網(wǎng))大數(shù)據(jù)智能分析的綜合集成系統(tǒng),建設具有示范引領意義的大數(shù)據(jù)應用。

2.5 完善大數(shù)據(jù)立法

在地方立法的權(quán)限范圍內(nèi),在信息采集、數(shù)據(jù)處理、敏感數(shù)據(jù)保護、數(shù)據(jù)交換標準和規(guī)則、個人隱私等方面設立大數(shù)據(jù)地方性法規(guī)和政府規(guī)章,確保大數(shù)據(jù)相關(guān)信息安全。加強建立大數(shù)據(jù)信息安全集中保障體系,開展基于大數(shù)據(jù)背景下信息安全認證體系建設,針對數(shù)據(jù)的收集、清先、存儲和運用等環(huán)節(jié)明確數(shù)據(jù)安全與保護的規(guī)則;明確劃分大數(shù)據(jù)生態(tài)中各不同主體的責任。同時鼓勵和支持企業(yè)在電子認證、安全測評、數(shù)據(jù)加強應急防范、容災備份等數(shù)據(jù)安全技術(shù)方面提供服務。

3 構(gòu)筑湖南省新型綠色大數(shù)據(jù)港灣的應注意的問題

大數(shù)據(jù)為管理者創(chuàng)造了新的機遇和挑戰(zhàn),在應用大數(shù)據(jù)推進我省建設的同時,需要特別注意潛在的問題,加強應對策略的研究。

3.1 重視數(shù)據(jù)的質(zhì)量

在利用大數(shù)據(jù)解決具體事務時,要客觀地認識大數(shù)據(jù)。數(shù)據(jù)本身有時也是存在缺陷的。有些數(shù)據(jù)收集時本身就是不正確的,有些數(shù)據(jù)之間還存在沖突、不一致等現(xiàn)象,因此,在運用這些數(shù)據(jù)時,“數(shù)據(jù)噪聲”則此產(chǎn)生,不同程度影響分析和決斷。公共部門或企業(yè)管理層在利用這些大數(shù)據(jù)進行分析時,需要對其收集的數(shù)據(jù)進行清洗、檢查、篩選,從而保障其運用的數(shù)據(jù)的質(zhì)量。

3.2 防止對數(shù)據(jù)過分依賴

科學預測與決策的有力武器是數(shù)據(jù),通過數(shù)據(jù)分析,從而為實現(xiàn)管理的智能化、增強管理能力及提高管理水平出謀劃策。但是,也應該看到數(shù)據(jù)不是完全可靠的,過度依賴數(shù)據(jù),一方面,會讓我們做很多沒有價值的數(shù)據(jù)分析;另一方面,也會限制本來應有的靈感和創(chuàng)意。只有讓讓數(shù)據(jù)真正嵌入到設計與決策中,讓直覺創(chuàng)造的心智能力,情感理解的社交能力,與大數(shù)據(jù)相結(jié)合,切實解決用戶的實際問題,真正做到“用戶洞察”,讓產(chǎn)品或措施體現(xiàn)用戶需求,服務用戶,超出用戶的預期想象。

3.3 加強信息安全機制建設

新技術(shù)新業(yè)務帶來大數(shù)據(jù)日見漸長的網(wǎng)絡安全問題,建議與實體經(jīng)濟安全相結(jié)合,進行統(tǒng)籌處理,同時建立關(guān)鍵信息安全管理制度,對互聯(lián)網(wǎng)平臺的職責劃分予以明確。制定數(shù)據(jù)安全風險評估機制,不僅關(guān)注數(shù)據(jù)本身,而且關(guān)注到數(shù)據(jù)資源整體的安全性,對特定類型的主體從事相關(guān)數(shù)據(jù)分析設定一定的條件。通過政府提供適當?shù)恼吆蛣罩С?,?chuàng)設輕松環(huán)境,加強相關(guān)的法律法規(guī)建設,保護數(shù)據(jù)透明開放同時保障信息安全。

4 構(gòu)筑湖南省大數(shù)據(jù)港灣的預期價值:

隨著商業(yè)企業(yè),政府公共事業(yè)應用的大量數(shù)據(jù),新產(chǎn)業(yè)數(shù)據(jù)大量涌現(xiàn),湖南新增經(jīng)濟增長空間,大數(shù)據(jù)形成新的產(chǎn)業(yè)鏈。圍繞上游與下游,必將推動智能終端的應用,促進云計算等行業(yè)快速發(fā)展。

大數(shù)據(jù)能有效減少社會經(jīng)營成本,提高經(jīng)濟與社會效率。例如在醫(yī)衛(wèi)行業(yè),可以通過大數(shù)據(jù)的分析避免重復治療、過度治療及減少錯誤治療,提高工作效率,提升治療質(zhì)量。公共管理領域,利用大數(shù)據(jù)提高教育部門、就業(yè)部門的服務效率,有效推動稅收工作開展,零售業(yè)領域,利用大數(shù)據(jù)改善和提高整體供應鏈和業(yè)務流程的效率,提高其經(jīng)營利潤60%以上。

大數(shù)據(jù)改變了傳統(tǒng)的商業(yè)模式,帶來了準確的營銷。有效提升企業(yè)數(shù)據(jù)資源利用率,提高從數(shù)據(jù)到信息的轉(zhuǎn)換率,使業(yè)務決策更加準確,提高整體運營效率。

大數(shù)據(jù)推動政府政務公開,提高公共決策的預見性和準確性。例如通過對社交網(wǎng)絡和手機短信中的信息進行分析,從而對失業(yè)率、疾病暴發(fā)等進行趨勢預測分析。利用大數(shù)據(jù)實現(xiàn)政府行政管理方面的運作效率提高,節(jié)省開支。

大數(shù)據(jù)有助于破解社會轉(zhuǎn)型中的難題。中國經(jīng)濟已進入轉(zhuǎn)型期,社會進入矛盾凸顯期,改革進入攻堅期。宏觀經(jīng)濟形勢錯綜復雜、各種社會改革盤根錯節(jié)、頻發(fā)等突出問題,僅僅依靠現(xiàn)有的管理手段與方法已明顯落后。有效地組織和使用大數(shù)據(jù),將對社會經(jīng)濟、科學研究、社會治理等產(chǎn)生巨大的推動作用。

5 結(jié)語

篇(7)

關(guān)鍵詞:大數(shù)據(jù)媒體;廣告營銷

2012年以來,大數(shù)據(jù)(big data)一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產(chǎn)生的海量數(shù)據(jù),并命名與之相關(guān)的技術(shù)發(fā)展與創(chuàng)新。數(shù)據(jù)正在迅速膨脹并變大,它決定著企業(yè)的未來發(fā)展,雖然很多企業(yè)可能并沒有意識到數(shù)據(jù)爆炸性增長帶來問題的隱患,但是隨著時間的推移,人們將越來越多地意識到數(shù)據(jù)對企業(yè)的重要性。哈佛大學社會學教授加里?金說:“這是一場革命,龐大的數(shù)據(jù)資源使得各個領域開始了量化進程,無論學術(shù)界、商界還是政府,所有領域都將開始這種進程。作為傳統(tǒng)媒體的廣告來說,在大數(shù)據(jù)時代將會面臨更為嚴峻的挑戰(zhàn)和考驗,同時也出現(xiàn)新的發(fā)展和機遇,廣告媒體需要抓住歷史性的機遇實現(xiàn)創(chuàng)新和發(fā)展。

廣告營銷是指企業(yè)通過廣告對產(chǎn)品展開宣傳推廣,促成消費者的直接購買,擴大產(chǎn)品的銷售,提高企業(yè)的知名度、美譽度和影響力的活動。隨著經(jīng)濟全球化和市場經(jīng)濟的迅速發(fā)展,在企業(yè)營銷戰(zhàn)略中廣告營銷活動發(fā)揮著越來越重要的作用,是企業(yè)營銷組合中的一個重要組成部分。大數(shù)據(jù)時代的廣告營銷在數(shù)據(jù)分析上的基礎上明確了廣告信息受眾。趣味廣告,互動廣告和個性化廣告是廣告營銷的發(fā)展趨勢。

1.數(shù)據(jù)分析與廣告信息受眾

大數(shù)據(jù)時代廣告信息傳播目的性更強,信息受眾經(jīng)過一系列數(shù)據(jù)挖掘與數(shù)據(jù)分析將更為準確。傳播媒體在大數(shù)據(jù)時代的作用將更為突出。傳媒作為溝通人類的橋梁,在移動化,社交化、智能化的今天已經(jīng)成為人們生活中必不可少的“陪伴”人們通過媒介使用在持續(xù)產(chǎn)生著海量數(shù)據(jù),這些數(shù)據(jù)將成為大數(shù)據(jù)時代的重要資源,同時傳媒也是溝通各種類型商家與用戶的紐帶,在數(shù)據(jù)分析的基礎上能夠通過傳媒使商家與用戶建立起深入、持續(xù)、穩(wěn)定的互動關(guān)系。

大數(shù)據(jù)時代的數(shù)據(jù)分析使得市場細分和目標市場選擇變得可視化。商家和媒體通過各種渠道收集和整理用戶數(shù)據(jù),并根據(jù)聚類分析劃分不同類型的信息受眾,使得市場細分和目標市場的選擇更加客觀,廣告的設計和投放能夠直接面對有相關(guān)需求的客戶。這種客觀性和直接性不僅表現(xiàn)在對廣告內(nèi)容的把握,更體現(xiàn)在對廣告投放渠道的選擇。

廣告營銷最重要的是效果,讓不同地域的受眾看到不同產(chǎn)品的廣告,利用獨有的區(qū)域定向模式技術(shù),將網(wǎng)民以地域 (精準到地級市) 為單位加以區(qū)分,打破了以往互聯(lián)網(wǎng)傳播只可泛不可精的區(qū)域傳播壁壘。大數(shù)據(jù)時代的市場細分將用戶的信息行為,包括瀏覽路徑,瀏覽內(nèi)容,停留時間,最終選擇等,轉(zhuǎn)化為可用數(shù)據(jù),并進行數(shù)據(jù)清洗與數(shù)據(jù)篩選,最后進行聚類,將屬性相同的用戶集中到一起,根據(jù)其特點選擇廣告投放內(nèi)容和途徑。并深入分析各節(jié)點之間的關(guān)系,找出其中規(guī)律,有目的地進行廣告,從而避免了廣告投放的盲目性,實現(xiàn)“不同人看不同廣告”的效果。

2.趣味廣告

通過對營銷以及傳媒發(fā)展歷史的梳理可以發(fā)現(xiàn),很多經(jīng)典的成功案例都與“趣味”這一因素密不可分,“笑聲”已經(jīng)成為廣告制勝的重要法寶,許多廣告因為幽默、生動、有趣而受到廣大觀眾的歡迎。觀眾的好感度直接影響著消費者對廣告產(chǎn)品的接受程度。好感度越高的產(chǎn)品和品牌更能得到消費者則的青睞。如此看來,廣告的“趣味”性是決定廣告是否成功的重要因素。

創(chuàng)意廣告出現(xiàn)的形式有很多種,其中主要有搞笑型、公益型、驚奇型、諷刺型、雷人型、夸張型、無聊型等多種形式,最主要的是要有創(chuàng)意,想象力。因網(wǎng)絡文化的發(fā)展創(chuàng)意廣告也隨之高登,受萬眾的歡迎。創(chuàng)意廣告具有滲透性、流傳性。能憑借吸引人的創(chuàng)意在網(wǎng)絡上迅速自發(fā)以葡萄藤形式推廣流傳。并讓廣告元素深入移植。主要以視頻的形式表現(xiàn)出來。趣味廣告要緊跟時代潮流或選擇有吸引性的主題。在廣告風格和廣告臺詞的設計上可以選擇網(wǎng)絡流行風向中的語言和表達。比如愛奇異視頻中的奇葩說欄目,將廣告宣傳內(nèi)容和節(jié)目選手結(jié)合起來,既幽默風趣,又體現(xiàn)產(chǎn)品的風格特點,牢牢地吸引了觀眾。很多廣告選擇電影中的經(jīng)典橋段進行設計,比如《大話西游》中的“如果上天能夠再給我一次機會,我希望是一萬年”臺詞的應用,益達廣告中經(jīng)典老歌“如果沒有你”的應用。

3.互動廣告

廣義的互動廣告是指所有互動形式的廣告,包括傳統(tǒng)媒體中的互動形式的廣告。西奧多?萊維特在其營銷哲學理論中提到“成功的營銷像是一場成功的婚姻,會不可避免地變成一種長久的關(guān)系,而買賣之間的相互交往界面也就變成可相互依存”。相互交往成為決定現(xiàn)代傳播成功與否的重要因素。Web2.0,web3.0技術(shù)的成熟發(fā)展為互動廣告提供了技術(shù)保證。微博,微信的廣泛使用為互動廣告提供經(jīng)驗。互聯(lián)網(wǎng)電子商務白熱化發(fā)展和小米粉絲營銷取得成功為互動廣告指明方向。大數(shù)據(jù)時代互動已經(jīng)成為現(xiàn)代傳媒業(yè)的一個重要特征。

由于PC、手機、平板電腦的終端特性,以及由此而產(chǎn)生的用戶與視頻之間的交互行為,讓視頻廣告產(chǎn)生了無限的互動可能,如圖所示:

圖1.互動廣告作品示意圖

4.個性化廣告

在大數(shù)據(jù)時代,個性化將顛覆一切傳統(tǒng)商業(yè)模式,成為未來商業(yè)發(fā)展的終極方向和新驅(qū)動力。大數(shù)據(jù)為個性化商業(yè)應用提供了充足的養(yǎng)分和持續(xù)發(fā)展的沃土,基于交叉融合后的可流轉(zhuǎn)性數(shù)據(jù),全息可見的消費者個體行為與偏好數(shù)據(jù)等等,未來的商業(yè)可以通過研究分析這些數(shù)據(jù),精準挖掘每一位消費者不同的興趣與愛好,從而為他們提供專屬的個性化產(chǎn)品和服務。大數(shù)據(jù)改變了商業(yè)模式,未來市場是一個性化消費者為中心的,“未來廣告的核心變化方向,是從現(xiàn)在每個人看同樣內(nèi)容的廣告,演化為每個人看不同內(nèi)容的廣告”所以營銷活動也要依托消費者這一中心展開創(chuàng)意的策劃和實施。

我們都知道以往的廣告模式是一對多的,廣告商不知道自己的廣告方式和手段是否滿足用戶的需求,但是隨著媒體掌握越來越多的用戶數(shù)據(jù),能夠方便地讓企業(yè)通過技術(shù)分析出關(guān)注企業(yè)的用戶具體屬性和用戶行為的畫像。通過這些洞察分析出來的這些用戶畫像,能夠讓企業(yè)對每類用戶進行有針對性的廣告服務。企業(yè)做廣告不僅是要針對新用戶,更重要的一點是對老用戶的激活。但是怎樣激活老用戶,以及和用戶更好地進行有效溝通,幾乎是廣告行業(yè)都撓頭的問題。但是運用大數(shù)據(jù)技術(shù)可以讓企業(yè)對 用戶生命周期進行管理和挖掘,讓企業(yè)對不同生命周期的用戶進行標簽化管理,讓企業(yè)及時把把相關(guān)運營信息推送給不同生命周期的用戶。

小結(jié)

大數(shù)據(jù)時代對于廣告營銷來說即使機遇,又是挑戰(zhàn)。廣告營銷要時刻注意時代和技術(shù)的發(fā)展和變遷才能在數(shù)據(jù)化的浪潮中處于不敗之地。趣味廣告、互動廣告、創(chuàng)意廣告是廣告營銷為適應時代的發(fā)展而產(chǎn)生的不同的緊跟時代的營銷形式,是發(fā)展的起點而不是中點。因此隨著人類邁向數(shù)據(jù)化的腳步越走越快,廣告也需要有更新更有效的營銷方式,而這將成為以后學者研究的重點。

參考文獻:

[1]歌曉.大數(shù)據(jù) 落地“三道坎”與信息安全[J].上海信息化.

[2]吳娜娜,任紅丹,張璨 .以多芬為例淺析廣告營銷[J].產(chǎn)業(yè)與科技論壇,2009(08):6-7.

[3]劉峰.大數(shù)據(jù)時代的電視媒體營銷研究[J].華東師范大學博士論文,2014.