《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 設(shè)計(jì)應(yīng)用 > 基于一種大數(shù)據(jù)應(yīng)用架構(gòu)的消費(fèi)者行為分析
基于一種大數(shù)據(jù)應(yīng)用架構(gòu)的消費(fèi)者行為分析
2014年微型機(jī)與應(yīng)用第20期
湯仁民1,,王代強(qiáng)2
1.貴州大學(xué) 電子信息學(xué)院,貴州 貴陽 550025,; 2.貴州大學(xué) 人民武裝學(xué)院,貴州 貴陽 550025
摘要: 研究了一種大數(shù)據(jù)的應(yīng)用程序框架,,通過使用拓?fù)鋽?shù)據(jù)結(jié)構(gòu),、共生技術(shù)分析和馬爾科夫鏈理論來分析消費(fèi)者的購買行為。首先將與消費(fèi)者相關(guān)的數(shù)據(jù)轉(zhuǎn)換成一種拓?fù)鋽?shù)據(jù)結(jié)構(gòu),;然后使用拓?fù)潢P(guān)系,、一種共生矩陣對(duì)消費(fèi)者行為進(jìn)行分析,推斷出馬爾柯夫鏈模型,。仿真結(jié)果證實(shí)了該理論框架的有效性,。
Abstract:
Key words :

  摘  要: 研究了一種大數(shù)據(jù)的應(yīng)用程序框架,,通過使用拓?fù)鋽?shù)據(jù)結(jié)構(gòu)、共生技術(shù)分析和馬爾科夫鏈理論來分析消費(fèi)者的購買行為,。首先將與消費(fèi)者相關(guān)的數(shù)據(jù)轉(zhuǎn)換成一種拓?fù)鋽?shù)據(jù)結(jié)構(gòu),;然后使用拓?fù)潢P(guān)系、一種共生矩陣對(duì)消費(fèi)者行為進(jìn)行分析,,推斷出馬爾柯夫鏈模型,。仿真結(jié)果證實(shí)了該理論框架的有效性。

  關(guān)鍵詞: 大數(shù)據(jù),;消費(fèi)者行為,;拓?fù)鋽?shù)據(jù)結(jié)構(gòu);馬爾科夫鏈

0 引言

  隨著云技術(shù)的應(yīng)用和普及,,利用“數(shù)據(jù)”對(duì)消費(fèi)者細(xì)分變得更為容易,,在此“數(shù)據(jù)”之下形成的“精準(zhǔn)”傳播正日益成為廠商的得力助手。大數(shù)據(jù)在經(jīng)濟(jì)分析,、災(zāi)害預(yù)報(bào),、產(chǎn)品和服務(wù)跟蹤、消費(fèi)行為洞察甚至在了解股市走向等方面大有用武之地,,在發(fā)達(dá)國家已經(jīng)開始普及應(yīng)用,,在中國也得到越來越多的運(yùn)用。

  在消費(fèi)領(lǐng)域,,通過數(shù)以百萬計(jì)的網(wǎng)絡(luò)傳感器和視頻監(jiān)控系統(tǒng),,人們能搜索到關(guān)于消費(fèi)者和供應(yīng)商的大量數(shù)據(jù)[1];各種媒體和社交網(wǎng)絡(luò)平臺(tái)中關(guān)于消費(fèi)者的數(shù)據(jù)更是呈現(xiàn)指數(shù)式增長,;用戶在各種社交網(wǎng)絡(luò)平臺(tái)中所生成的未經(jīng)編輯的信息,,包括結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù),讓人眼花繚亂,。把這些海量數(shù)據(jù)統(tǒng)一稱作大數(shù)據(jù),。一般情況下,大數(shù)據(jù)具有批量,、多品種,、快速度三種特性[2-3]。

  另一方面,,消費(fèi)者行為分析是對(duì)消費(fèi)者,、產(chǎn)品商、運(yùn)營商之間對(duì)諸如購買,、節(jié)約,、商標(biāo)選擇等方面的關(guān)注[4]。此外,如今的消費(fèi)者稱號(hào)不再是指過去單一的消費(fèi)者行為,,對(duì)他們的定義不再僅是買家,,更是一種會(huì)引導(dǎo)電商零售企業(yè)營銷方式變遷的模式。為了分析消費(fèi)者行為,,獲取更多的信息是有必要的。在這個(gè)方面,,對(duì)數(shù)據(jù)驅(qū)動(dòng)決策作出,,處理大數(shù)據(jù)已經(jīng)成為了中心角色[5]。在大數(shù)據(jù)平臺(tái)中所搜集的數(shù)據(jù)的性質(zhì)是各不相同的,,為了分析這些數(shù)據(jù),僅數(shù)據(jù)的數(shù)量和性質(zhì)而言就是一個(gè)艱巨的挑戰(zhàn)[6],。本文用圖1所示的框架結(jié)構(gòu),,通過數(shù)學(xué)拓?fù)湟约芭c馬爾科夫鏈相結(jié)合的共生分析理論來分析這些海量數(shù)據(jù)以及如何能夠獲取有用的信息。

001.jpg

1 消費(fèi)者行為分析的大數(shù)據(jù)框架

  應(yīng)用于消費(fèi)者行為分析的大數(shù)據(jù)框架圖由三個(gè)功能層組成,,分別是數(shù)據(jù)組織層、分析建模層,、預(yù)測推理層[7-8]。在數(shù)據(jù)組織層,,收集到的數(shù)據(jù)在一個(gè)動(dòng)力系統(tǒng)中被組織,,以至于該數(shù)據(jù)能夠被看作是一個(gè)時(shí)間序列。具體而言,,假設(shè)隨機(jī)變量分別為:

  Xt:在時(shí)間t時(shí)的數(shù)據(jù)量。

  Yt:出現(xiàn)在時(shí)間間隔為[t,,t+1]的新數(shù)據(jù),。

  Zt:出現(xiàn)在時(shí)間間隔為[t,,t+1]的劣化數(shù)據(jù)。

  該數(shù)據(jù)流可以在一個(gè)隨機(jī)方程中建模為:

  1.png

  可以通過線性回歸馬爾科夫鏈在式(2)中獲得Xt:

  E[Yt+1|Yt]=(1-ρ)E(Y)+ρYt(2)

  通過式(1)乘以Yt+1,,再取其期望,,同時(shí)使t→∞,,這樣能夠獲得式(3):

  (1-ρ)E(XY)=(1-ρ)E(X)E(Y)+ρE(Y2)-ρE(Y)(3)

  在式(1)中代入E(XY)的值,,通過式(4)獲得大數(shù)據(jù)的平均量:

  4.png

  對(duì)于代表當(dāng)前特別關(guān)注的變量Xt,通過方程(4)將會(huì)得出時(shí)間序列數(shù)據(jù),。經(jīng)產(chǎn)生的時(shí)間序列數(shù)據(jù),,構(gòu)造出拓?fù)鋽?shù)據(jù)結(jié)構(gòu),這樣大數(shù)據(jù)能夠被存儲(chǔ)為所構(gòu)造的拓?fù)鋽?shù)據(jù)而不失其一般性,,該優(yōu)勢是對(duì)大存儲(chǔ)器的需求顯著減少。同時(shí),,重要的信息能夠通過使用離散集而獲得,可以利用拓?fù)浣Y(jié)構(gòu)對(duì)該種消費(fèi)行為進(jìn)行研究,。拓?fù)鋽?shù)據(jù)結(jié)構(gòu)的基本概念是認(rèn)識(shí)其數(shù)據(jù)的形狀或模式,用于發(fā)現(xiàn)數(shù)據(jù),,識(shí)別其有意義的數(shù)據(jù)子集,這樣的拓?fù)鋽?shù)據(jù)結(jié)構(gòu)由滿足包含,、相交和封閉性的采樣數(shù)據(jù)的子集集合而成,。以下三種關(guān)鍵性的拓?fù)湫再|(zhì)使得從大數(shù)據(jù)中可能提取出具有一定價(jià)值的數(shù)據(jù):(1)無坐標(biāo)性;(2)提取不同形狀下的一種客體模式的能力,;(3)不失其重要特性的壓縮形狀,。

  適用于上述三種特性的共生矩陣被處于分析建模層中的數(shù)據(jù)結(jié)構(gòu)所建立。按行歸一化的共生矩陣,、馬爾科夫轉(zhuǎn)移概率都能被估計(jì),,同時(shí)形成了一步轉(zhuǎn)移概率矩陣P。然后平穩(wěn)分布π以及隨時(shí)間變化分布的Pt能夠通過(5)式獲得,。最后這些可能性在預(yù)測推理層被用于獲取所需的特定信息。

  π=πPPt+1=Pt·P(5)

2 實(shí)驗(yàn)結(jié)果



  為了說明該架構(gòu),,對(duì)合成的消費(fèi)者購買行為數(shù)據(jù)進(jìn)行模擬,。把購買消費(fèi)品的時(shí)間序列數(shù)據(jù)收集起來并在表1中顯示出來,,該數(shù)據(jù)包含了4種消費(fèi)品和10個(gè)時(shí)間點(diǎn),。包含消費(fèi)品的整個(gè)數(shù)據(jù)集是Xt={a,b,c,,d},,拓?fù)銽被定義為Xt的子集集合,這樣T包含一個(gè)空集和整個(gè)集,,T中的兩個(gè)集合并一定被包含在T中,,且T中任何兩個(gè)集合的交叉點(diǎn)也必須被包含在T中,這樣包含的拓?fù)潢P(guān)系被用于建立處于拓?fù)銽中數(shù)據(jù)集之間的共生矩陣,。相應(yīng)的共生矩陣如表2所示,。通過共生矩陣行歸一化能夠得到一步轉(zhuǎn)移概率矩陣P。當(dāng)t=2,,3,,4,…時(shí),,通過計(jì)算Pt能夠獲得t步轉(zhuǎn)移概率,。在一般情況下,平衡狀態(tài)在t的一個(gè)有限值內(nèi)達(dá)到,。因此,,當(dāng)t=1,2,,3,,…時(shí),通過繪制相應(yīng)的t步概率獲得該種趨勢圖,。最后,,必要的信息能夠通過圖2所示的消費(fèi)者趨勢圖推導(dǎo)出。在圖2中,,水平線表示時(shí)間點(diǎn),,垂直線表示購買成對(duì)商品的模式。其中大數(shù)據(jù)分析最重要的方面之一便是通過解碼圖2中被編碼的定量信息和定性信息以顯示其結(jié)構(gòu)和模式,。通過圖2的解釋線圖能夠觀察到,,在其他配對(duì)線趨勢圖之間,配對(duì)線趨勢圖(a,,b)是最可能的結(jié)合,,其次是配對(duì)線趨勢圖(a,d),。接下來發(fā)現(xiàn)的是包括物品b的線是處于頂部的一些線,,這意味著物品b是最受歡迎的物品,這樣的結(jié)果與原始數(shù)據(jù)一致,。結(jié)合了物品d但是沒有包括物品b的線是最低的,這解釋為物品d是最不受歡迎的。

002.jpg

3 結(jié)論

  本文結(jié)合消費(fèi)者行為的非結(jié)構(gòu)化數(shù)據(jù),,呈現(xiàn)了一種大數(shù)據(jù)應(yīng)用程序框架,。這是大數(shù)據(jù)分析的早期階段,在消費(fèi)領(lǐng)域,,通過使用真實(shí)的生活數(shù)據(jù),,分析消費(fèi)品的購買情況,在網(wǎng)絡(luò)平臺(tái)上將會(huì)產(chǎn)生大量的數(shù)據(jù)源,,通過這些數(shù)據(jù)精準(zhǔn)了解消費(fèi)者心理對(duì)企業(yè)的功能和作用,,特別是對(duì)營銷來說更具有特別重大和實(shí)際的意義。

參考文獻(xiàn)

  [1] 吳響,,張立,,趙強(qiáng),等.基于體域網(wǎng)的遠(yuǎn)程健康監(jiān)護(hù)系統(tǒng)設(shè)計(jì)[J].電子技術(shù)應(yīng)用,,2014,,40(3):19-21.

  [2] 黃升民,楊雪睿.碎片化背景下消費(fèi)行為的新變化與發(fā)展趨勢[J].廣告大觀(理論版),,2006(2):4-9.

  [3] 竇炳琳,,李澍淞,張世永.基于結(jié)構(gòu)的社會(huì)網(wǎng)絡(luò)分析[J].計(jì)算機(jī)學(xué)報(bào),,2012,,35(4):99-111.

  [4] 大數(shù)據(jù)成為信息科技新關(guān)注點(diǎn)[J].硅谷,2012(13):I0012.

  [5] 楊華磊.高頻數(shù)據(jù)對(duì)傳統(tǒng)經(jīng)濟(jì)學(xué)研究范式的沖擊[EB/OL].[2013-01-27].blog.sciencenet.cn/blog-456786-656901.html.

  [6] 涂子沛.大數(shù)據(jù)[M].桂林:廣西師范大學(xué)出版社,,2012.

  [7] Zhang Yihua,, BLANTON M. Efficient dynamic provable possession of remote data via update trees[J]. Rearch in Computer Security(ESORICS′09), 2012(3):42-45.

  [8] Lin Jun,, Yang Guangyu. Analyzing customer behavior Predicting-what happens next[DB]. Publisher: Across Technology,, 2010(2):53-56.


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載,。