文獻(xiàn)標(biāo)識(shí)碼: A
DOI: 10.19358/j.issn.2096-5133.2021.11.006
引用格式: 洪志理,賴俊,,曹雷,等. 融合用戶興趣建模的智能推薦算法研究[J].信息技術(shù)與網(wǎng)絡(luò)安全,,2021,40(11):37-48.
0 引言
推薦系統(tǒng)[1],,作為大數(shù)據(jù)時(shí)代方便人們?cè)邶嫶蟮目蛇x項(xiàng)目中快速準(zhǔn)確定位到自己感興趣物品的工具,,基本思想是通過(guò)構(gòu)建模型從用戶的歷史數(shù)據(jù)中提取用戶和物品的特征,利用訓(xùn)練好的模型對(duì)用戶有針對(duì)地推薦物品,。
近年來(lái)隨著強(qiáng)化學(xué)習(xí)的快速發(fā)展,,將強(qiáng)化學(xué)習(xí)應(yīng)用于推薦系統(tǒng)的研究越來(lái)越受到關(guān)注,首次將深度強(qiáng)化學(xué)習(xí)應(yīng)用于推薦系統(tǒng)的探索模型是DRN[2],,為深度強(qiáng)化學(xué)習(xí)在推薦系統(tǒng)中的應(yīng)用構(gòu)建了基本框架,圖1所示為基于深度強(qiáng)化學(xué)習(xí)的推薦系統(tǒng)框圖,。
目前基于深度強(qiáng)化學(xué)習(xí)的推薦系統(tǒng)研究已有諸多研究成果,,如童向榮[3]等人將DQN應(yīng)用于以社交網(wǎng)絡(luò)為基礎(chǔ)的信任推薦系統(tǒng)中,應(yīng)用于智能體學(xué)習(xí)用戶之間信任度的動(dòng)態(tài)表示,,并基于這種信任值來(lái)為用戶做推薦;劉帥帥[4]將DDQN應(yīng)用于電影推薦中來(lái)解決推薦精確度低,、速度慢以及冷啟動(dòng)等問(wèn)題;Munemasa[5]等人將DDPG算法應(yīng)用于店鋪推薦,,來(lái)解決用戶數(shù)據(jù)稀疏問(wèn)題,;Zhao[6]等人將Actor-Critic算法應(yīng)用于列表式推薦,,來(lái)解決傳統(tǒng)推薦模型只能將推薦過(guò)程建模為靜態(tài)過(guò)程的問(wèn)題。上述研究成果以及未在此羅列的眾多研究均是利用強(qiáng)化學(xué)習(xí)本身的性質(zhì)來(lái)解決推薦問(wèn)題,,很少?gòu)耐扑]角度出發(fā)考慮問(wèn)題。
本文詳細(xì)內(nèi)容請(qǐng)下載:http://forexkbc.com/resource/share/2000003846
作者信息:
洪志理,,賴 俊,,曹 雷,陳希亮
(陸軍工程大學(xué) 指揮控制工程學(xué)院,,江蘇 南京210007)