期刊大全 雜志訂閱 SCI期刊 投稿指導(dǎo) 期刊服務(wù) 文秘服務(wù) 出版社 登錄/注冊 購物車(0)

首頁 > 公文范文 > 電子商務(wù)中數(shù)據(jù)挖掘技術(shù)的運(yùn)用

電子商務(wù)中數(shù)據(jù)挖掘技術(shù)的運(yùn)用

時(shí)間:2022-07-23 10:06:02

序論:寫作是一種深度的自我表達(dá)。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內(nèi)心深處的真相,好投稿為您帶來了一篇電子商務(wù)中數(shù)據(jù)挖掘技術(shù)的運(yùn)用范文,愿它們成為您寫作過程中的靈感催化劑,助力您的創(chuàng)作。

電子商務(wù)中數(shù)據(jù)挖掘技術(shù)的運(yùn)用

電子商務(wù)數(shù)據(jù)挖掘技術(shù)的運(yùn)用:電子商務(wù)數(shù)據(jù)挖掘論文

1數(shù)據(jù)挖掘過程

在電子商務(wù)進(jìn)行應(yīng)用的數(shù)據(jù)挖掘技術(shù)的實(shí)現(xiàn)過程大致要?jiǎng)澐譃槿齻€(gè)不同的階段:第一部分對需要挖掘的數(shù)據(jù)信息的準(zhǔn)備階段,第二部分對數(shù)據(jù)信息的挖掘階段,第三部分的主要任務(wù)是對數(shù)據(jù)挖掘的結(jié)果進(jìn)行解釋與評價(jià).

1.1數(shù)據(jù)信息的準(zhǔn)備準(zhǔn)備部分又可以分成數(shù)據(jù)的選取、數(shù)據(jù)信息的預(yù)處理.對數(shù)據(jù)進(jìn)行選取的主要目的就是對操作對象進(jìn)行確定,即是對目標(biāo)數(shù)據(jù)進(jìn)行確定,所謂的目標(biāo)數(shù)據(jù)是在經(jīng)過對用戶的需要進(jìn)行細(xì)致分析之后,對最有可能得到有利用價(jià)值的信息的那些從數(shù)據(jù)庫中抽取出來的數(shù)據(jù).獲取到這些數(shù)據(jù)以后需要進(jìn)行預(yù)處理,主要包含數(shù)據(jù)的去噪、計(jì)算缺值數(shù)據(jù)的推導(dǎo)、數(shù)據(jù)類型的轉(zhuǎn)換,數(shù)據(jù)類型轉(zhuǎn)換舉個(gè)例子來說比如把連續(xù)型數(shù)據(jù)轉(zhuǎn)化成離散數(shù)據(jù),以方便進(jìn)行符號的歸納.

1.2挖掘過程數(shù)據(jù)信息的挖掘階段是在上一步的基礎(chǔ)之上,即在目標(biāo)數(shù)據(jù)已經(jīng)確定,并且已經(jīng)完成了初始化的基礎(chǔ)之上,需要確定數(shù)據(jù)挖掘的目的與挖掘的類型.在對挖掘任務(wù)的目標(biāo)確定之后,要根據(jù)數(shù)據(jù)挖掘的知識類型選取合適的數(shù)據(jù)挖掘方法,最終完成數(shù)據(jù)挖掘具體操作即采用特定的數(shù)據(jù)挖掘方法從數(shù)據(jù)倉庫中抽取所需的挖掘目標(biāo).

1.3挖掘結(jié)果的解釋和評價(jià)數(shù)據(jù)挖掘的結(jié)果的解釋和評價(jià)是在完成數(shù)據(jù)挖掘階段之后對發(fā)現(xiàn)的知識,進(jìn)行評估,對于冗余或者無關(guān)的知識要進(jìn)行刪除;對于獲得的知識不符合用戶的要求的要進(jìn)行重新的挖掘.與此同時(shí),因?yàn)閿?shù)據(jù)挖掘需要面臨用戶,所以,在得到目標(biāo)知識以后還需要對所挖掘的知識附加相關(guān)解釋,來用一種便于用戶理解的方式供用戶使用.綜上所述,整個(gè)數(shù)據(jù)信息的挖掘在實(shí)際情況下是一個(gè)不斷地循環(huán)與反復(fù)的過程,所以要對所挖掘出來的知識不斷求精和深化,最終要獲得用戶所需要的結(jié)果.

2電子商務(wù)中數(shù)據(jù)挖掘的特點(diǎn)

由于電子商務(wù)自身的某些獨(dú)特的特點(diǎn),同其他的應(yīng)用于普通商業(yè)領(lǐng)域中的數(shù)據(jù)挖掘相比,應(yīng)用于電子商務(wù)的數(shù)據(jù)挖掘具有如下幾個(gè)特點(diǎn):(1)應(yīng)用于電子商務(wù)的數(shù)據(jù)挖掘的最終目的主要表現(xiàn)在企業(yè)與客戶之間的關(guān)系管理方面,電子商務(wù)利用因特網(wǎng)的技術(shù)能夠使企業(yè)和客戶之間的關(guān)系處理變得更加方便.所以,其主要的功能是怎樣使企業(yè)采用這些頻繁的交流信息,快速的掌握客戶的趨向、改善與客戶交流情況或者獲取交流方向等;(2)電子商務(wù)本身就是一個(gè)信息化程度比較高的系統(tǒng),其自身累積的數(shù)據(jù)信息會存放在電子商務(wù)數(shù)據(jù)庫內(nèi),用戶可以比較便捷地得到這些信息,所以對于電子商務(wù)的數(shù)據(jù)挖掘的數(shù)據(jù)信息的準(zhǔn)備階段的相關(guān)工作就變得相對容易;(3)電子商務(wù)領(lǐng)域的數(shù)據(jù)挖掘的主要目標(biāo)一般是使電子商務(wù)系統(tǒng)得到有效的改進(jìn).例如為客戶提供個(gè)性化頁面、把用戶比較感興趣的信息展現(xiàn)在網(wǎng)站首頁或得到哪一些商品比較受到客戶的歡迎等.

3電子商務(wù)中的數(shù)據(jù)挖掘運(yùn)用

首先要講的是關(guān)聯(lián)規(guī)則在電子商務(wù)中的運(yùn)用,利用比較通俗的語言來講,從一個(gè)事件的發(fā)生與否方面進(jìn)行解釋,所謂的關(guān)聯(lián)規(guī)則法在大量的事件發(fā)生或者不發(fā)生的條件下,對這些事件中的任意兩個(gè)或者多個(gè)事件提取出來,通過一定的統(tǒng)計(jì)分析算法,最終確定兩個(gè)或者多個(gè)事件的發(fā)生與否是否存在著某種關(guān)系,而這種可能存在的管理,我們稱之為關(guān)聯(lián)規(guī)則.列舉一個(gè)有趣的故事,就是在一個(gè)超市里面,店家把小孩的尿布同啤酒放到了一起,來供購買者進(jìn)行購買,結(jié)果是二者的銷量都提升了一倍,其實(shí)這就是因?yàn)槎咧g有著某種潛在聯(lián)系,店家通過數(shù)據(jù)挖掘的方法發(fā)現(xiàn)的這個(gè)規(guī)則,并對這一關(guān)聯(lián)規(guī)則進(jìn)行了實(shí)際的運(yùn)用,從中得到了益處.同樣在電子商務(wù)中通過數(shù)據(jù)挖掘得到關(guān)聯(lián)規(guī)則,有著類似的意義.其次在電子商務(wù)中數(shù)據(jù)挖掘聚類分析方法的應(yīng)用.在大量數(shù)據(jù)倉庫中,數(shù)據(jù)與數(shù)據(jù)之間,往往會有某些性質(zhì)的類型相似,同樣也會有某些性質(zhì)或者特點(diǎn)相異,我們把這些性質(zhì)或者特點(diǎn)稱為觀察指標(biāo),聚類分析就是對于某一個(gè)特點(diǎn)指標(biāo)而言,把指標(biāo)相差不多的數(shù)據(jù)劃分為同一個(gè)類型,若相差較大則要?jiǎng)澐譃椴煌念愋?、這種操作的主要意義就是將具有某種特定的相似特性的客戶或者數(shù)據(jù)分成一個(gè)類.在電子商務(wù)活動中,這一方法的應(yīng)用主要集中在市場細(xì)分的工作之中.分類分析系統(tǒng)的建立以生物的遺傳算法為基礎(chǔ),屬于其中的自學(xué)習(xí)的一種,它一般會包含三個(gè)子系統(tǒng),第一個(gè)是以串規(guī)則為基礎(chǔ)的并行生成子系統(tǒng)、第二個(gè)是規(guī)則評價(jià)子系統(tǒng).第三個(gè)是遺傳算法子系統(tǒng).分類分析可以說是電子商務(wù)中運(yùn)用到數(shù)據(jù)挖掘最多的一種挖掘方式.主要原因就是在于其能夠形成一種預(yù)測模型能夠?qū)σ恍I銷方式或者其他的一些商業(yè)措施做出正確的預(yù)測.

4數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用

更高效的利用企業(yè)現(xiàn)有資源以及開發(fā)新資源是當(dāng)代企業(yè)發(fā)展的關(guān)鍵.電子商務(wù)通過采用數(shù)據(jù)挖掘的技術(shù),能夠更加及時(shí)和正確的獲得企業(yè)當(dāng)前所有資源的具體使用情況,而且通過數(shù)據(jù)挖掘的技術(shù)可以分析以往的各種企業(yè)數(shù)據(jù),比如說企業(yè)財(cái)務(wù)數(shù)據(jù)、企業(yè)庫存數(shù)據(jù)或者企業(yè)交易數(shù)據(jù),能夠較為及時(shí)的發(fā)現(xiàn)企業(yè)資源過度消耗的主要問題所在,或者能夠得到各種商務(wù)活動的投入與產(chǎn)出的比例,來為企業(yè)領(lǐng)導(dǎo)進(jìn)行經(jīng)營決策提供有力的根據(jù)[6].另外在企業(yè)的經(jīng)營過程中,人們不斷推崇“以客戶為中心”的經(jīng)營理念,在這一趨勢下,如何正確快速的分析和了解客戶的需求已成為企業(yè)提高自身市場競爭力的一大課題.通過把數(shù)據(jù)挖掘應(yīng)用到電子商務(wù)之中,能夠使企業(yè)最準(zhǔn)確的分析客戶資源并最有效的利用企業(yè)客戶資源,通過對已有客戶行為進(jìn)行相關(guān)性分析,可以形成潛在客戶資源的預(yù)測模型.除此之外在企業(yè)經(jīng)營過程中,利用數(shù)據(jù)挖掘可以解決另外一個(gè)嚴(yán)重影響了商業(yè)正常秩序的重要問題.即當(dāng)前時(shí)區(qū)商務(wù)活動中的地下的信用狀況問題,這一問題的嚴(yán)重程度已經(jīng)引起了人們的廣泛關(guān)注.在電子商務(wù)經(jīng)營過程中,因?yàn)榫W(wǎng)上詐騙公司或者企業(yè)財(cái)務(wù)的現(xiàn)象屢見不鮮,信用危機(jī)已經(jīng)成為影響其快速正常發(fā)展的一個(gè)重要因素.而通過在電子商務(wù)中采用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)對企業(yè)經(jīng)營活動的跟蹤,在此基礎(chǔ)上實(shí)現(xiàn)企業(yè)的資產(chǎn)評估、利潤收益分析以及發(fā)展?jié)摿︻A(yù)測分析等,為電子商務(wù)在經(jīng)營過程中提供了完善的安全保障體系,同時(shí)利用數(shù)據(jù)挖掘?qū)崿F(xiàn)企業(yè)網(wǎng)上全程監(jiān)控.另外通過實(shí)現(xiàn)基于數(shù)據(jù)挖掘的信用評估模型,可以在很大程度上進(jìn)行防范或者化解信用風(fēng)險(xiǎn),從而提高企業(yè)的信用度以及應(yīng)對風(fēng)險(xiǎn)能力.

5結(jié)束語

電子商務(wù)是而今信息化時(shí)代進(jìn)步的產(chǎn)物,在未來的幾年內(nèi)電子商務(wù)必將會成為商業(yè)中存在的主要運(yùn)營模式.隨著時(shí)間的積累,各種電子商務(wù)都會得到巨大的數(shù)據(jù)信息資源,這也是數(shù)據(jù)挖掘在電子商務(wù)中應(yīng)用的基本條件.從另外一方面而言,隨著數(shù)據(jù)挖掘在電子商務(wù)方面中的不斷深入研究與發(fā)展,已經(jīng)能夠向電子商務(wù)系統(tǒng)提供必不可少的技術(shù)支持,促進(jìn)了電子商務(wù)的發(fā)展與普及。

作者:張莉單位:合肥工業(yè)大學(xué)淮北職業(yè)技術(shù)學(xué)院

電子商務(wù)中數(shù)據(jù)挖掘技術(shù)的運(yùn)用:數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中應(yīng)用

[摘要]電子商務(wù)的廣泛應(yīng)用使企業(yè)產(chǎn)生了大量的業(yè)務(wù)數(shù)據(jù),按企業(yè)既定業(yè)務(wù)目標(biāo)對這些數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘可以幫助企業(yè)分析出完成任務(wù)所需的關(guān)鍵因素。文章介紹了數(shù)據(jù)挖掘技術(shù),以實(shí)例分析了數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用,并介紹了在電子商務(wù)中如何應(yīng)用數(shù)據(jù)挖掘技術(shù)。

[關(guān)鍵詞]電子商務(wù);數(shù)據(jù)挖掘;路徑分析

隨著Internet的普及,電子商務(wù)的興起,人們的商務(wù)理念正在改變,電子商務(wù)的廣泛應(yīng)用使企業(yè)產(chǎn)生了大量的業(yè)務(wù)數(shù)據(jù),如何更快、更好地利用各種有效的數(shù)據(jù)更好地開展電子商務(wù),這是目前電子商務(wù)急需解決的問題。

一、數(shù)據(jù)挖掘技術(shù)

20世紀(jì)90年代以來,隨著信息技術(shù)和數(shù)據(jù)庫技術(shù)的迅猛發(fā)展,人們可以非常方便地獲取和存儲大量的數(shù)據(jù)。面對大規(guī)模的海量的數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)分析工具(如管理信息系統(tǒng))只能進(jìn)行一些表層的處理(如查詢、統(tǒng)計(jì)等),而不能獲得數(shù)據(jù)之間的內(nèi)在關(guān)系和隱含的信息。為了擺脫“數(shù)據(jù)豐富,知識貧乏”的困境,人們迫切需要一種能夠智能地自動地把數(shù)據(jù)轉(zhuǎn)換成有用信息和知識的技術(shù)和工具,這種對強(qiáng)有力數(shù)據(jù)分析工具的迫切需求使得數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。人們認(rèn)識到數(shù)據(jù)庫中存儲的數(shù)據(jù)量急劇增大,在大量的數(shù)據(jù)背后隱藏著許多重要的信息,如果能把這些信息從數(shù)據(jù)庫中抽取出來,將為公司創(chuàng)造很多潛在的利潤。這種從海量數(shù)據(jù)庫中挖掘信息的技術(shù),就稱之為數(shù)據(jù)挖掘。數(shù)據(jù)挖掘一般有以下四類主要任務(wù):

(一)數(shù)據(jù)總結(jié)

數(shù)據(jù)挖掘能夠?qū)?shù)據(jù)庫中的有關(guān)數(shù)據(jù)從較低的個(gè)體層次抽象總結(jié)到較高的總體層次上,從而實(shí)現(xiàn)對原始基本數(shù)據(jù)的總體把握。

(二)分類

分析數(shù)據(jù)的各種屬性,并找出數(shù)據(jù)的屬性模型,確定哪些數(shù)據(jù)屬于哪些組。這樣我們就可以利用該模型來分析已有數(shù)據(jù),并預(yù)測新數(shù)據(jù)將屬于哪一個(gè)組。

(三)關(guān)聯(lián)分析

數(shù)據(jù)庫中的數(shù)據(jù)一般都存在著關(guān)聯(lián)關(guān)系,也就是說,兩個(gè)或多個(gè)變量的取值之間存在某種規(guī)律性。通過挖掘數(shù)據(jù)派生關(guān)聯(lián)規(guī)則,可以了解客戶的行為。

(四)聚類

聚類分析是按照某種相近程度度量方法,將用戶數(shù)據(jù)分成一系列有意義的子集合。每一個(gè)集合中的數(shù)據(jù)性質(zhì)相近,不同集合之間的數(shù)據(jù)性質(zhì)相差較大。

數(shù)據(jù)挖掘的特點(diǎn)和性質(zhì)對于企業(yè)而言,有助于發(fā)現(xiàn)其企業(yè)業(yè)務(wù)發(fā)展的趨勢,揭示已知的事實(shí),預(yù)測未知的結(jié)果,并幫助企業(yè)分析出完成任務(wù)所需的關(guān)鍵因素,以達(dá)到增加收入,降低成本,使企業(yè)處于更有利的競爭位置的目的。

二、數(shù)據(jù)挖掘在電子商務(wù)中的作用

數(shù)據(jù)挖掘技術(shù)源于商業(yè)的直接需求,因此它在各種商業(yè)領(lǐng)域都存在廣泛的使用價(jià)值。電子商務(wù)是商業(yè)領(lǐng)域的一種新興商務(wù)模式,是指利用電子信息技術(shù)開展一切商務(wù)活動。當(dāng)電子商務(wù)在企業(yè)中得到應(yīng)用時(shí),企業(yè)信息系統(tǒng)將產(chǎn)生大量數(shù)據(jù),這些海量數(shù)據(jù)使數(shù)據(jù)挖掘有了豐富的數(shù)據(jù)基礎(chǔ),同時(shí)高性能計(jì)算機(jī)和高傳輸速率網(wǎng)絡(luò)的使用也給數(shù)據(jù)挖掘技術(shù)提供了堅(jiān)實(shí)的保障。因此數(shù)據(jù)挖掘技術(shù)在電子商務(wù)活動中有了更大的用武之地。下面介紹數(shù)據(jù)挖掘在以下電子商務(wù)幾個(gè)方面的作用:

(一)客戶細(xì)分

隨著“以客戶為中心”的經(jīng)營理念的不斷深入人心,分析客戶、了解客戶并引導(dǎo)客戶的需求已成為企業(yè)經(jīng)營的重要課題。通過對電子商務(wù)系統(tǒng)收集的交易數(shù)據(jù)進(jìn)行分析,可以按各種客戶指標(biāo)(如自然屬性、收入貢獻(xiàn)、交易額、價(jià)值度等)對客戶分類,然后確定不同類型客戶的行為模式,以便采取相應(yīng)的營銷措施,促使企業(yè)利潤的最大化。

(二)客戶獲得

利用數(shù)據(jù)挖掘可以有效地獲得客戶。比如通過數(shù)據(jù)挖掘可以發(fā)現(xiàn)購買某種商品的消費(fèi)者是男性還是女性,學(xué)歷、收入如何,有什么愛好,是什么職業(yè)等等。甚至可以發(fā)現(xiàn)不同的人在購買該種商品的相關(guān)商品后多長時(shí)間有可能購買該種商品,以及什么樣的人會購買什么型號的該種商品等等。也許很多因素表面上看起來和購買該種商品不存在任何聯(lián)系,但數(shù)據(jù)挖掘的結(jié)果卻證明它們之間有聯(lián)系。在采用了數(shù)據(jù)挖掘后,針對目標(biāo)客戶發(fā)送的廣告的有效性和回應(yīng)率將得到大幅度的提高,推銷的成本將大大降低。

(三)客戶保持

數(shù)據(jù)挖掘可以把你大量的客戶分成不同的類,在每個(gè)類里的客戶擁有相似的屬性,而不同類里的客戶的屬性也不同。你完全可以做到給不同類的客戶提供完全不同的服務(wù)來提高客戶的滿意度。數(shù)據(jù)挖掘還可以發(fā)現(xiàn)具有哪些特征的客戶有可能流失,這樣挽留客戶的措施將具有針對性,挽留客戶的費(fèi)用將下降。

(四)交叉銷售

交叉銷售可以使企業(yè)比較容易地得到關(guān)于客戶的豐富的信息,而這些大量的數(shù)據(jù)對于數(shù)據(jù)挖掘的準(zhǔn)確性來說是有很大幫助的。在企業(yè)所掌握的客戶信息,尤其是以前購買行為的信息中,可能正包含著這個(gè)客戶決定他下一個(gè)購買行為的關(guān)鍵,甚至決定因素。這個(gè)時(shí)候數(shù)據(jù)挖掘的作用就會體現(xiàn)出來,它可以幫助企業(yè)尋找到這些影響他購買行為的因素。

(五)個(gè)性服務(wù)

當(dāng)客戶在電子商務(wù)網(wǎng)站注冊時(shí),客戶將會看到帶有客戶姓名的歡迎詞。根據(jù)客戶的訂單紀(jì)錄,系統(tǒng)可以向客戶顯示那些可能引起客戶特殊興趣的新商品。當(dāng)客戶注意到一件特殊的商品時(shí),系統(tǒng)會建議一些在購買中可以增加的其他商品。普通的產(chǎn)品目錄手冊常常簡單地按類型對商品進(jìn)行分組,以簡化客戶挑選商品的步驟。然而對于在線商店,商品分組可能是完全不同的,它常常以針對客戶的商品補(bǔ)充條目為基礎(chǔ)。不僅考慮客戶看到的條目,而且還考慮客戶購物籃中的商品。使用數(shù)據(jù)挖掘技術(shù)可以使推薦更加個(gè)性化。

(六)資源優(yōu)化

節(jié)約成本是企業(yè)盈利的關(guān)鍵。通過分析歷史的財(cái)務(wù)數(shù)據(jù)、庫存數(shù)據(jù)和交易數(shù)據(jù),可以發(fā)現(xiàn)企業(yè)資源消耗的關(guān)鍵點(diǎn)和主要活動的投入產(chǎn)出比例,從而為企業(yè)資源優(yōu)化配置提供決策依據(jù),例如降低庫存、提高庫存周轉(zhuǎn)率、提高資金使用率等。

(七)異常事件的確定

在許多商業(yè)領(lǐng)域中,異常事件具有顯著的商業(yè)價(jià)值,如客戶流失、銀行的信用卡欺詐、電信中移動話費(fèi)拖欠等。通過數(shù)據(jù)挖掘中的奇異點(diǎn)分析可以迅速準(zhǔn)確地甄別這些異常事件。

由此可見數(shù)據(jù)挖掘在電子商務(wù)中有著重要的作用。在生活中采用數(shù)據(jù)挖掘的成功的例子很多。例如總部位于美國阿肯色州的WalMart零售商的“尿布與啤酒”的故事。WalMart擁有世界上最大的數(shù)據(jù)倉庫系統(tǒng),它利用數(shù)據(jù)挖掘工具對數(shù)據(jù)倉庫中的原始交易數(shù)據(jù)進(jìn)行分析,得到了一個(gè)意外發(fā)現(xiàn):跟尿布一起購買最多的商品竟然是啤酒。如果不是借助于數(shù)據(jù)倉庫和數(shù)據(jù)挖掘,商家決不可能發(fā)現(xiàn)這個(gè)隱藏在背后的事實(shí):在美國,一些年輕的父親下班后經(jīng)常要到超市去買嬰兒尿布,而他們中有30%~40%的人同時(shí)也為自己買一些啤酒。有了這個(gè)發(fā)現(xiàn)后,超市調(diào)整了貨架的擺放,把尿布和啤酒放在一起,明顯增加了銷售額。

三、電子商務(wù)中如何應(yīng)用數(shù)據(jù)挖掘技術(shù)

數(shù)據(jù)挖掘在電子商務(wù)中有廣泛的應(yīng)用。那么在電子商務(wù)中是如何應(yīng)用數(shù)據(jù)挖掘技術(shù)的?

首先,從挖掘過程說,對在線訪問客戶數(shù)據(jù)的挖掘主要有兩部分:一部分是客戶訪問信息的挖掘,另一部分是客戶登記信息的挖掘。面對大量的訪問日志,首先要做的就是對數(shù)據(jù)進(jìn)行清洗,即預(yù)處理,把無關(guān)的數(shù)據(jù),不重要的數(shù)據(jù)等處理掉;接著對數(shù)據(jù)進(jìn)行事務(wù)識別,通過對事務(wù)進(jìn)行劃分后,就可以根據(jù)具體的分析需求選擇模式發(fā)現(xiàn)的技術(shù),如路徑分析、興趣關(guān)聯(lián)規(guī)則、聚類等。通過模式分析,找到有用的信息,再通過聯(lián)機(jī)分析(OLAP)的驗(yàn)證,結(jié)合客戶登記信息,找出有價(jià)值的市場信息,或發(fā)現(xiàn)潛在的市場。

其次,挖掘方法主要有以下幾種:

1.路徑分析

路徑分析是一種找尋頻繁訪問路徑的方法,它通過對Web服務(wù)器的日志文件中客戶訪問站點(diǎn)的訪問次數(shù)分析,挖掘出頻繁訪問路徑。例如:一客戶從某一站點(diǎn)訪問到某一感興趣的頁面后就會經(jīng)常訪問該頁面,通過路徑分析確定頻繁訪問路徑,可以了解客戶對哪些頁面感興趣,(下轉(zhuǎn)第78頁)(上接第80頁)從而更好地改進(jìn)設(shè)計(jì),為客戶服務(wù)。

2.興趣關(guān)聯(lián)規(guī)則

當(dāng)客戶訪問某一網(wǎng)頁時(shí),一般會通過興趣詞條找出相關(guān)的興趣網(wǎng)頁通過鏈接繼續(xù)訪問,這種關(guān)聯(lián)產(chǎn)生的數(shù)據(jù)如果能夠按照某種策略進(jìn)行挖掘分析,統(tǒng)計(jì)出客戶訪問某些頁面及興趣關(guān)聯(lián)頁面的比率,就可以很好地組織站點(diǎn),實(shí)施有效的市場策略。

3.聚類分析

聚類分析是電子商務(wù)中很重要的一個(gè)方面,通過分組聚類出具有相似瀏覽行為的客戶,并分析客戶的共同特征,更好地幫助電子商務(wù)的用戶了解自己的客戶,向客戶提供更合適的服務(wù)。如通過對眾多的瀏覽“camera”網(wǎng)頁的客戶分析,發(fā)現(xiàn)在該網(wǎng)頁上經(jīng)?;ㄒ欢螘r(shí)間瀏覽的客戶,再通過對這部分客戶的登記資料分析,知道這些客戶是潛在要買相機(jī)的客戶群體。就可以調(diào)整“camera”網(wǎng)頁的內(nèi)容和風(fēng)格,以適應(yīng)客戶的需要。

通過以上幾種數(shù)據(jù)分析的方法可以有效地對電子商務(wù)中的信息進(jìn)行分析,從而更有效地開展電子商務(wù)。

目前,數(shù)據(jù)挖掘技術(shù)正以前所未有的速度發(fā)展,并且擴(kuò)大著用戶群體,在未來越來越激烈的市場競爭中,擁有數(shù)據(jù)挖掘技術(shù)必將比別人獲得更快速的反應(yīng),贏得更多的商業(yè)機(jī)會。現(xiàn)在世界上的主要數(shù)據(jù)庫廠商紛紛開始把數(shù)據(jù)挖掘功能集成到自己的產(chǎn)品中,加快數(shù)據(jù)挖掘技術(shù)的發(fā)展。我國在這一領(lǐng)域正處在研究開發(fā)階段,加快研究數(shù)據(jù)挖掘技術(shù),并把它應(yīng)用于電子商務(wù)中,應(yīng)用到更多行業(yè)中,勢必會有更好的商業(yè)機(jī)會和更光明的前景。

電子商務(wù)中數(shù)據(jù)挖掘技術(shù)的運(yùn)用:電子商務(wù)發(fā)展與數(shù)據(jù)挖掘技術(shù)應(yīng)用

摘要:本文從浙江電子商務(wù)發(fā)展概況出發(fā),介紹了數(shù)據(jù)挖掘技術(shù),分析了數(shù)據(jù)挖掘技術(shù)在浙江電子商務(wù)中應(yīng)用的可行性。

關(guān)鍵詞:數(shù)據(jù)挖掘;浙江;電子商務(wù)

當(dāng)前,電子商務(wù)正在全國范圍內(nèi)迅猛發(fā)展,隨著國務(wù)院《關(guān)于積極推進(jìn)“互聯(lián)網(wǎng)+”行動的指導(dǎo)意見》、《關(guān)于大力發(fā)展電子商務(wù)加快培育經(jīng)濟(jì)新動力的意見》等一系列的政策落地,“農(nóng)村電商、跨境電商、行業(yè)電商”等多種電商模式迎來了重要發(fā)展機(jī)遇。浙江的電子商務(wù)起步早、發(fā)展快、創(chuàng)新性強(qiáng),在全國電商市場里名列前茅,已經(jīng)成為浙江經(jīng)濟(jì)發(fā)展重要的增長極,產(chǎn)生了巨大的經(jīng)濟(jì)效應(yīng)和社會效應(yīng)。

1浙江電子商務(wù)發(fā)展概況

1.1電商服務(wù)發(fā)達(dá)

2015年浙江省實(shí)現(xiàn)網(wǎng)絡(luò)零售額7610.62億元,同比增長49.9%,總量居全國第二位,超額完成“十二五”規(guī)劃目標(biāo)。網(wǎng)絡(luò)零售額與社會消費(fèi)品零售總額比值達(dá)38%,遠(yuǎn)遠(yuǎn)高于全國約15%的水平。各類電子商務(wù)市場主體蓬勃發(fā)展,擁有各類活躍網(wǎng)店100多萬家,天貓網(wǎng)店近2.5萬家,跨境電商經(jīng)營主體近4萬個(gè),電商服務(wù)企業(yè)3000家左右,其中規(guī)模以上電子商務(wù)服務(wù)企業(yè)約1000家;建有電商產(chǎn)業(yè)基地204個(gè);電子商務(wù)帶動直接就業(yè)超過200萬人。

1.2線上線下高度融合

浙江是制造業(yè)大省,也是電子商務(wù)大省。成熟的市場環(huán)境,促成線上線下的高度融合。以金華為例,線下有“義烏小商品市場”、“永康五金市場”等國內(nèi)乃至國際一流的行業(yè)市場,依托這些實(shí)體市場的突出優(yōu)勢,著力打造“義烏購”、“尚五金”等線上平臺,構(gòu)建線上線下高度融合的市場環(huán)境。

2數(shù)據(jù)挖掘技術(shù)初探

2.1數(shù)據(jù)挖掘簡介

數(shù)據(jù)挖掘技術(shù)起源于20世紀(jì)80年代,它是從數(shù)據(jù)庫海量數(shù)據(jù)中提取使用者所感興趣的知識、數(shù)據(jù)和規(guī)律,進(jìn)行深入的分析,提取隱含在其中的、潛在有用的信息,為使用者提供決策支持。從電子商務(wù)的角度來看,它的主要作用是從電子商務(wù)活動中抽取大量數(shù)據(jù),進(jìn)行轉(zhuǎn)讓、分析和模式化處理,從中獲得能幫助電子商務(wù)企業(yè)決策的關(guān)鍵信息,即從電子商務(wù)大量業(yè)務(wù)數(shù)據(jù)中尋找隱含的商機(jī)或者新的商業(yè)模式。

2.2數(shù)據(jù)挖掘在電子商務(wù)領(lǐng)域的應(yīng)用

在電商商務(wù)活動的過程中,電商企業(yè)積累了大量的銷售記錄、瀏覽記錄、消費(fèi)和服務(wù)記錄等數(shù)據(jù),隨著電子商務(wù)不斷發(fā)展,相關(guān)數(shù)據(jù)不斷的膨脹擴(kuò)大,在堆積如山的數(shù)據(jù)中包含著許多待提取的有用知識,這些有用知識進(jìn)行挖掘是非常有意義的。數(shù)據(jù)挖掘有助于電商企業(yè)識別客戶購買行為,發(fā)現(xiàn)客戶的購買模式及趨勢,便于電商企業(yè)改進(jìn)銷售模式、提高服務(wù)質(zhì)量,提高客戶的用戶體驗(yàn)。并且,可以根據(jù)海量數(shù)據(jù)分析,提高貨品銷售比率,優(yōu)化物流和分銷策略,進(jìn)一步降低成本。1)分析客戶的購買行為和習(xí)慣。例如“男性客戶購買尿不濕的同時(shí)會購買啤酒”,“該女性客戶對化妝品和護(hù)膚品的品牌偏好”,“某客戶偏好折扣商品”,這些信息雖然看起來微不足道,卻非常有用,電商企業(yè)可以根據(jù)客戶購買行為和習(xí)慣向客戶推送他們偏好的信息。2)分析電商企業(yè)的商品構(gòu)成。將各類商品按盈利水平和銷售情況進(jìn)行分類,挖掘同類商品的共同特征,提取有用信息。幫助企業(yè)決策市場定位、商品定價(jià)等問題。3)數(shù)據(jù)挖掘還可以幫助企業(yè)進(jìn)行銷售商品預(yù)測、商品價(jià)格分析等,在浙江線上線下高度融合的市場環(huán)境下,電商企業(yè)可以挖掘商品價(jià)格、銷售和物流信息的關(guān)聯(lián),合理安排線上線下商品銷售模式,提高企業(yè)運(yùn)營效率,降低銷售成本。

3結(jié)束語

浙江電子商務(wù)的快速發(fā)展,各類電商企業(yè)在這片土地上生根發(fā)芽,數(shù)量不斷增多,市場競爭日趨激烈。有效的利用數(shù)據(jù)挖掘工具,挖掘隱含在海量數(shù)據(jù)中的有用信息,能夠使企業(yè)做出正常的市場決策,保持有力的競爭優(yōu)勢,贏得消費(fèi)者的青睞。隨著信息技術(shù)的不斷發(fā)展,數(shù)據(jù)挖掘的不斷深入,電子商務(wù)數(shù)據(jù)挖掘的研究和應(yīng)用必將取得長遠(yuǎn)的發(fā)展。

作者:陳麗燕 何士產(chǎn) 洪改艷 單位:上海財(cái)經(jīng)大學(xué)浙江學(xué)院

電子商務(wù)中數(shù)據(jù)挖掘技術(shù)的運(yùn)用:數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用

1數(shù)據(jù)挖掘的概念及其過程

1.1數(shù)據(jù)挖掘

數(shù)據(jù)挖掘,即在數(shù)據(jù)庫中的信息發(fā)現(xiàn),是指在大量的、不完整的、模糊的、有噪音的和隨機(jī)的數(shù)據(jù)中,提取出潛在的、不為人知的、同時(shí)又是非常有用的知識和信息的過程。數(shù)據(jù)挖掘是一項(xiàng)應(yīng)用技術(shù)廣泛的交叉學(xué)科,它聚集了眾多不同領(lǐng)域的知識,例如人工智能、可視化、數(shù)據(jù)庫、數(shù)理統(tǒng)計(jì)等。從始至終數(shù)據(jù)挖掘技術(shù)都是面向應(yīng)用領(lǐng)域,不僅是對于特定數(shù)據(jù)庫的簡單檢索查詢,還包括對數(shù)據(jù)的不同層面、不同角度的統(tǒng)計(jì)、分析、推理和綜合,以此得到問題的求解,以及發(fā)現(xiàn)事件之間的聯(lián)系,還有對未發(fā)生活動的預(yù)測。另外數(shù)據(jù)挖掘技術(shù)在存在大量數(shù)據(jù)積累的電子商務(wù)行業(yè)有著廣泛的應(yīng)用,是現(xiàn)代商務(wù)企業(yè)發(fā)展的不二選擇。

1.2數(shù)據(jù)挖掘的過程

1.2.1數(shù)據(jù)預(yù)處理

在實(shí)際情況中,企業(yè)獲得的數(shù)據(jù)具有不完整性、模糊性和冗余性,所以數(shù)據(jù)挖掘技術(shù)針對的不是已得到的數(shù)據(jù),而是潛在的數(shù)據(jù)信息,并通過預(yù)處理技術(shù)獲得簡潔、準(zhǔn)確的數(shù)據(jù)。預(yù)處理的工作分為三步,數(shù)據(jù)合并、數(shù)據(jù)選擇和數(shù)據(jù)清洗。先將多個(gè)數(shù)據(jù)庫和文件中的數(shù)據(jù)進(jìn)行合并,然后選擇適合分析的數(shù)據(jù)信息集合,最后剔除無關(guān)記錄,并將各個(gè)文件轉(zhuǎn)換成方便數(shù)據(jù)挖掘的格式。

1.2.2模式發(fā)現(xiàn)

這個(gè)階段就是利用挖掘計(jì)算技術(shù)挖掘出有用的、潛在的、新穎的、可以理解的知識和信息。像關(guān)聯(lián)分析、聚類分析、路徑選擇、序列分析等都可以用于Web的挖掘技術(shù)。

1.2.3模式分析

這個(gè)階段是將模式發(fā)現(xiàn)中沒有用的模式和規(guī)則過濾掉。通過技術(shù)分析,得到有效的結(jié)論。常用關(guān)聯(lián)規(guī)則、序列等手段。

2數(shù)據(jù)挖掘技術(shù)的方法

2.1關(guān)聯(lián)分析

所謂的關(guān)聯(lián)分析,就是利用數(shù)據(jù)間相互關(guān)聯(lián)的規(guī)則進(jìn)行數(shù)據(jù)挖掘,為的是挖掘數(shù)據(jù)間潛在的聯(lián)系規(guī)則。比如,在進(jìn)行關(guān)聯(lián)分析時(shí),能發(fā)現(xiàn)類似哪些產(chǎn)品更受客戶的歡迎、為什么、產(chǎn)品優(yōu)勢有哪些、有多少客戶會再次購買等問題。

2.2序列模式分析

這個(gè)過程和第一個(gè)關(guān)聯(lián)分析有些類似,但主要任務(wù)是發(fā)現(xiàn)數(shù)據(jù)間的前后順序聯(lián)系,比如在這段時(shí)間里,企業(yè)先銷售出x產(chǎn)品,隨后銷售y產(chǎn)品,然后是z產(chǎn)品,所以就形成x-y-z的銷售序列,出現(xiàn)頻率較高,進(jìn)而對其進(jìn)行分析。序列模式分析工作方向是:在指定的交易數(shù)據(jù)庫中,找出按照時(shí)間排布的交易集,發(fā)現(xiàn)其中的高頻序列,從而進(jìn)行下一個(gè)步驟。

2.3分類分析

假設(shè)有一個(gè)數(shù)據(jù)庫和一組互相區(qū)別的標(biāo)記,利用特殊標(biāo)記數(shù)據(jù)庫中的每一個(gè)數(shù)據(jù),這樣的數(shù)據(jù)庫被叫做訓(xùn)練集或者實(shí)例數(shù)據(jù)庫。分類分析就是利用分析標(biāo)記數(shù)據(jù)庫中的每一個(gè)數(shù)據(jù),對每個(gè)類別建立分析模型或做出精準(zhǔn)的描述或者挖掘出分析模型,然后利用分類模式對數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行分類分析。

2.4聚類分析

聚類分析所根據(jù)的分類規(guī)則主要取決于聚類分析工具。不同的聚類方法,對于同樣的記錄集合會有不同的劃分結(jié)果。聚類分析針對的未分類的記錄,而且所有記錄適合分成幾類,事先也不知情,然后依據(jù)一定的分類規(guī)則,分析記錄數(shù)據(jù),確定每一個(gè)數(shù)據(jù)所對應(yīng)的類別。

3數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用

3.1優(yōu)化企業(yè)資源

企業(yè)盈利的關(guān)鍵是節(jié)約成本,利用數(shù)據(jù)挖掘技術(shù)可以找到企業(yè)消耗資源的關(guān)鍵點(diǎn)和各種活動的投入與產(chǎn)出比例,進(jìn)而為企業(yè)提供科學(xué)合理的調(diào)整方案,例如資源循環(huán)利用、降低庫存等方法。通過數(shù)據(jù)挖掘技術(shù),企業(yè)可以預(yù)先知道市場上的商業(yè)信息,使企業(yè)把握市場動態(tài),創(chuàng)造更多的盈利。

3.2管理客戶資料

俗話說知己知彼,百戰(zhàn)不殆。對于企業(yè)來說,了解客戶是至關(guān)重要的,比如客戶是男是女、愛好是什么、職業(yè)是什么等,從而根據(jù)不同客戶需求,改善網(wǎng)絡(luò)結(jié)構(gòu),推出個(gè)性化網(wǎng)頁,吸引更多的客戶對本企業(yè)的關(guān)注。例如對電子商務(wù)網(wǎng)站的網(wǎng)站流量進(jìn)行分析。人們在點(diǎn)擊或者是訪問某一個(gè)網(wǎng)站的同時(shí),就將個(gè)人對網(wǎng)站內(nèi)容的反饋信息反映了出來,用戶點(diǎn)擊了哪一個(gè)鏈接,在哪個(gè)網(wǎng)頁中停留的時(shí)間最長,采用了哪個(gè)搜索的項(xiàng)目或者是總共使用的瀏覽時(shí)間等信息都會被保存在網(wǎng)站中,將這些信息保存下來,進(jìn)行數(shù)據(jù)分析,能夠有效的確定用戶的訪問特點(diǎn)以及產(chǎn)品特征,從而提高電子商務(wù)信息提供的精確性。

3.3評估商業(yè)信譽(yù)

一個(gè)企業(yè)若是沒有良好的商業(yè)信譽(yù)做基礎(chǔ),一切都是空口說白話。所以建立有效的商業(yè)評估制度就成了重中之重。利用數(shù)據(jù)挖掘技術(shù)對企業(yè)營銷進(jìn)行追蹤,開展資產(chǎn)評估、發(fā)展?jié)摿︻A(yù)測以及利潤收益分析,建立完善的安全系統(tǒng),對企業(yè)商譽(yù)安全進(jìn)行保障,可以有效的預(yù)防和解決信用風(fēng)險(xiǎn),提高企業(yè)信譽(yù)度。例如,商品售賣出去,要進(jìn)行科學(xué)有效的跟蹤,了解客戶用后體驗(yàn),對客戶使用產(chǎn)品情況進(jìn)行追蹤式分析,開展科學(xué)合理的資產(chǎn)評估,不斷發(fā)展?jié)撛谟脩趔w驗(yàn),通過客戶的反饋信息進(jìn)行綜合性分析,提高客戶滿意度,提高商家的信用。

3.4確定異常事件

在商業(yè)領(lǐng)域中,確定異常事件具有十分重要的商業(yè)價(jià)值。在企業(yè)經(jīng)營時(shí)間里,經(jīng)常會有異常事件發(fā)生,例如話費(fèi)拖欠、客戶流失、信用卡欺詐等,通過數(shù)據(jù)挖掘技術(shù)中的異常點(diǎn)分析可以十分準(zhǔn)確快速地發(fā)現(xiàn)異常點(diǎn),使企業(yè)及時(shí)修整系統(tǒng),減少不必要損失。例如,當(dāng)客戶將商品加入購物車后,對沒有付款的原因進(jìn)行科學(xué)合理的分析,從而確定要催付的客戶群體。這種催付的行為在一定程度上可能會打擾到客戶,所以需要準(zhǔn)確的分析其真正的原因。例如客戶沒有付款的主要原因?yàn)椋哼z忘、沖動消費(fèi)不想買了、貨比三家,發(fā)現(xiàn)更好地商品、支付發(fā)生故障等。這個(gè)時(shí)候就需要商家對號入座,確定是否要進(jìn)行客戶催付。這就需要數(shù)據(jù)挖掘技術(shù)發(fā)揮自身的優(yōu)勢,進(jìn)行數(shù)據(jù)分析,提出相應(yīng)的解決方案。在催付時(shí)間的選擇上,根據(jù)數(shù)據(jù)挖掘技術(shù)的分析通常情況下理論上在第三天進(jìn)行催付是最為合理的,因?yàn)樵诘诙煊胁簧贂园l(fā)付款的客戶。同時(shí)還需要考慮到女性消費(fèi)者沖動購物的習(xí)慣,過了這個(gè)沖動期就不容易再購買。所以實(shí)際上要在客戶下單的第二天進(jìn)行催付最為合理。在擬定催付內(nèi)容的時(shí)候需要科學(xué)分析客戶一天各個(gè)時(shí)間段的情緒變化,減少客戶對商家的排斥與厭煩的心理。

4結(jié)語

隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,電子商務(wù)已經(jīng)成為現(xiàn)如今經(jīng)濟(jì)發(fā)展的主要方式。數(shù)據(jù)挖掘技術(shù)是電子商務(wù)發(fā)展的重要手段。利用數(shù)據(jù)挖掘可以幫助企業(yè)從大量的繁雜的數(shù)據(jù)中發(fā)現(xiàn)潛在的規(guī)律,找到有效的信息,以此指導(dǎo)企業(yè)調(diào)整經(jīng)營策略,提高企業(yè)聲譽(yù),獲得更有利的競爭能力。

作者:邢玉鳳 單位:云南經(jīng)濟(jì)管理學(xué)院