一對(duì)多協(xié)商協(xié)調(diào)策略研究-AET-電子技術(shù)應(yīng)用

一對(duì)多協(xié)商協(xié)調(diào)策略研究

日期： 2009-07-07

作者：姚永雷, 馬利

關(guān)鍵詞： 模糊推理模糊集合模糊規(guī)則模糊邏輯三種

　　摘? 要: 介紹了一種基于模糊邏輯的協(xié)調(diào)策略。協(xié)調(diào)策略考慮協(xié)商過(guò)程中的各種因素，包括時(shí)間、對(duì)手?jǐn)?shù)目、對(duì)手的提議等，使用模糊規(guī)則和模糊推理，對(duì)多個(gè)相互影響的并發(fā)一對(duì)一協(xié)商進(jìn)行協(xié)調(diào)。實(shí)驗(yàn)證明，該策略能夠很好地適應(yīng)信息不完全的環(huán)境。
　　關(guān)鍵詞： 一對(duì)多協(xié)商；協(xié)調(diào)策略；模糊邏輯

　　自動(dòng)協(xié)商是多主體系統(tǒng)MAS(Multi-agent System)中的一個(gè)研究熱點(diǎn)。沖突是協(xié)商的起點(diǎn), 整個(gè)過(guò)程是一個(gè)協(xié)商雙方或多方不斷妥協(xié)、就共同關(guān)心的問(wèn)題力求達(dá)成一致的動(dòng)態(tài)交互過(guò)程。根據(jù)參與協(xié)商者的數(shù)量可將協(xié)商劃分為：一對(duì)一協(xié)商、一對(duì)多協(xié)商、多對(duì)多協(xié)商^[1]。
　　隨著主體技術(shù)在電子商務(wù)、網(wǎng)格等領(lǐng)域的應(yīng)用，一對(duì)多協(xié)商受到愈來(lái)愈多的重視。早期的一對(duì)多協(xié)商研究主要是采用拍賣(mài)作為參與方的協(xié)商策略。但是拍賣(mài)方式極不靈活，而且買(mǎi)賣(mài)雙方的信息交流不充分^[2]。因此，研究人員將一對(duì)多協(xié)商轉(zhuǎn)化為多個(gè)并發(fā)的一對(duì)一協(xié)商^[2～4]，于是多個(gè)并發(fā)的一對(duì)一協(xié)商之間的相互協(xié)調(diào)就變得尤為重要。
　　多個(gè)并發(fā)的一對(duì)一協(xié)商組成的一對(duì)多協(xié)商是一個(gè)較新的課題。目前, 并發(fā)協(xié)商的研究還處于起步階段。參考文獻(xiàn)[2]提出了三種協(xié)調(diào)策略，參考文獻(xiàn)[3]主要研究了并發(fā)協(xié)商的承諾管理問(wèn)題，參考文獻(xiàn)[4]提出了一種基于相對(duì)效用理論的協(xié)調(diào)策略。但是，協(xié)商過(guò)程中由于信息不完全而導(dǎo)致的不確定性和復(fù)雜性沒(méi)有被充分考慮。本文提出了一種基于模糊邏輯的一對(duì)多協(xié)商的協(xié)調(diào)策略，用來(lái)控制多個(gè)并行進(jìn)行的一對(duì)一協(xié)商。實(shí)驗(yàn)結(jié)果證明，這種策略能較好地適應(yīng)動(dòng)態(tài)、不確定的環(huán)境，幫助主體尋找花費(fèi)盡可能少、同時(shí)具有更高性?xún)r(jià)比的協(xié)商結(jié)果。
1 一對(duì)一協(xié)商模型
它向?qū)Ψ桨l(fā)送一個(gè)Accept消息，協(xié)商成功結(jié)束；如果某一方的時(shí)間門(mén)限已經(jīng)到達(dá)而仍未達(dá)成一致，則此方向?qū)Ψ桨l(fā)送一個(gè)Withdraw消息，協(xié)商失敗。
當(dāng)主體g收到協(xié)商對(duì)手的一個(gè)提議X時(shí)，首先計(jì)算這個(gè)提議的效用V^g(x)，如果大于等于τ^g，則接受這個(gè)提議，協(xié)商成功結(jié)束；否則，如果時(shí)間沒(méi)有超時(shí)，則計(jì)算讓步幅度C并給對(duì)方一個(gè)新的提議，其中C代表上一個(gè)提議和本次提議的效用之差。采用參考文獻(xiàn)[5]的算法來(lái)計(jì)算C。
2 一對(duì)多協(xié)商模型
??? 把一對(duì)多協(xié)商轉(zhuǎn)化為多個(gè)并發(fā)的一對(duì)一協(xié)商，需要一個(gè)協(xié)調(diào)者，基于某種協(xié)調(diào)策略對(duì)多個(gè)并發(fā)的一對(duì)一協(xié)商進(jìn)行協(xié)調(diào)，確保多個(gè)并發(fā)的一對(duì)一協(xié)商能夠有效、有序地執(zhí)行。圖1 是一對(duì)多協(xié)商的系統(tǒng)結(jié)構(gòu)圖。

　　假設(shè)主體Negotiator有n個(gè)協(xié)商對(duì)手。Negotiator主體由一個(gè)Coordinator和n個(gè)sub-negotiator組成，每個(gè)sub-negotiator對(duì)應(yīng)一個(gè)協(xié)商對(duì)手，代表Negotiator和一個(gè)協(xié)商對(duì)手進(jìn)行一對(duì)一協(xié)商，稱(chēng)之為一個(gè)協(xié)商線(xiàn)程(thread)。Coordinator負(fù)責(zé)協(xié)調(diào)各協(xié)商線(xiàn)程。
2.1 協(xié)商線(xiàn)程
　　所有sub-negotiator具有相同的知識(shí)，包括Negotiator主體的偏好、協(xié)商時(shí)間等。每個(gè)sub-negotiator都使用參考文獻(xiàn)[5]引入的雙邊協(xié)商算法。但是，這些sub-negotiator的建議產(chǎn)生機(jī)制不盡相同，具體表現(xiàn)在讓步速度參數(shù)的不同[5]。因?yàn)榻ㄗh產(chǎn)生機(jī)制和協(xié)商對(duì)手的不同，所有sub-negotiator的行為是不相同的。
　　在每個(gè)協(xié)商回合，第i個(gè)sub-negotiator收到對(duì)手的消息，其決策過(guò)程如下:
　　(1)如果收到Accept消息，則向Coordinator報(bào)告協(xié)商成功，并報(bào)告達(dá)成的服務(wù)合約；終止此協(xié)商線(xiàn)程；
　　(2)如果收到Withdraw消息，則向Coordinator報(bào)告協(xié)商失敗，終止此協(xié)商線(xiàn)程；
　　(3)如果對(duì)手的提議可以接受，則向Coordinator報(bào)告協(xié)商成功，并報(bào)告達(dá)成的服務(wù)合約；
　　(4)如果對(duì)手的提議不可接受，則首先根據(jù)參考文獻(xiàn)[5]中的一對(duì)一協(xié)商策略計(jì)算下一回合向?qū)κ肿尣降姆龋缓笙駽oordinator報(bào)告對(duì)手的提議和擬讓步幅度Ci，并等待Coordinator對(duì)擬讓步幅度的調(diào)整，產(chǎn)生一個(gè)新的提議。
　　可以看出，在每個(gè)協(xié)商回合，sub-negotiator都要向Coordinator報(bào)告當(dāng)前協(xié)商線(xiàn)程的狀態(tài)，并根據(jù)Coordinator的指令向?qū)κ痔嶙h。
2.2 協(xié)商協(xié)調(diào)策略
　　首先，Coordinator是一個(gè)信息集中的地方。在一個(gè)協(xié)商線(xiàn)程中的每個(gè)協(xié)商回合，sub-negotiator就向Coordinator報(bào)告當(dāng)前各協(xié)商線(xiàn)程的狀態(tài)。Coordinator記錄當(dāng)前仍在活動(dòng)的協(xié)商線(xiàn)程數(shù)目m，維持一個(gè)當(dāng)前各協(xié)商對(duì)手的最新提議列表，并計(jì)算最大效用V_m=max{V(p₁),V(p₂),… V(p_m)以及協(xié)商距離Δ=τ－V_m。
　　最重要的是，Coordinator負(fù)責(zé)協(xié)調(diào)各個(gè)協(xié)商線(xiàn)程。每當(dāng)收到一個(gè)sub-negotiator的報(bào)告，Coordinator的決策過(guò)程如下：
　　(1)如果此協(xié)商線(xiàn)程成功結(jié)束，則Coordinator中止所有協(xié)商線(xiàn)程，協(xié)商結(jié)束。
　　(2)如果此協(xié)商線(xiàn)程失敗，則Coordinator終止此協(xié)商線(xiàn)程，并更新自己的知識(shí)：當(dāng)前仍在活動(dòng)的協(xié)商線(xiàn)程數(shù)目m、當(dāng)前各協(xié)商對(duì)手的最新提議列表、以及最大效用和協(xié)商距離。
　　(3)如果此協(xié)商線(xiàn)程仍在進(jìn)行，則sub-negotiator給Coordinator的報(bào)告包括以下內(nèi)容：協(xié)商對(duì)手的最新提議和擬讓步幅度Ci。Coordinator更新自己的知識(shí)，對(duì)Ci進(jìn)行調(diào)整，并通知sub-negotiator新的讓步幅度。
　　在對(duì)擬讓步幅度進(jìn)行調(diào)整時(shí)，Coordinator考慮當(dāng)前的形勢(shì)，包括當(dāng)前仍在活動(dòng)的協(xié)商線(xiàn)程數(shù)目m、時(shí)間t以及協(xié)商距離Δ，基于模糊規(guī)則和Sugeno模糊推理系統(tǒng)進(jìn)行決策。之所以基于模糊規(guī)則和Sugeno模糊推理系統(tǒng)，是因?yàn)橹黧w掌握的信息不完全，必須面對(duì)不確定性，而模糊推理已經(jīng)被證明適用于許多具有這個(gè)特點(diǎn)的領(lǐng)域。
　　具體地，調(diào)整策略的規(guī)則庫(kù)具體意義如下：
　　(1)如果當(dāng)前時(shí)間t很接近tmax，則大幅度地調(diào)大整體讓步幅度Ci；
　　(2)如果當(dāng)前仍在活動(dòng)的線(xiàn)程數(shù)目m很大，時(shí)間t不接近t_max，但是協(xié)商距離Δ比較大，則幾乎不用調(diào)整整體讓步幅度；
　　(3)如果當(dāng)前仍在活動(dòng)的線(xiàn)程數(shù)目m很大，時(shí)間t不接近t_max，而且協(xié)商距離Δ較小，則調(diào)小讓步幅度；
　　(4)如果當(dāng)前仍在活動(dòng)的線(xiàn)程數(shù)目m很小，協(xié)商距離Δ比較大，但是時(shí)間t距t_max較遠(yuǎn)，則幾乎不用調(diào)整整體讓步幅度；
　　(5)如果當(dāng)前仍在活動(dòng)的線(xiàn)程數(shù)目m很小，但是時(shí)間t距t_max較遠(yuǎn)，而且協(xié)商距離Δ比較小，則調(diào)小整體讓步幅度；
　　(6)如果當(dāng)前仍在活動(dòng)的線(xiàn)程數(shù)目m很小，協(xié)商距離Δ比較大，時(shí)間t距t_max不遠(yuǎn)不近，則調(diào)大整體讓步幅度；
　　(7)如果當(dāng)前仍在活動(dòng)的線(xiàn)程數(shù)目m很小，協(xié)商距離Δ比較小，時(shí)間t距t_max不遠(yuǎn)不近，則幾乎不用調(diào)整整體讓步幅度。
　　“t is close-to/medium-to/far-from tmax”用模糊集合表示，如圖2所示。
　　

　　表示“m is big/small”的模糊集合如圖3。

　　表示“Δ is big/small“的模糊集合如圖4。

　　這些模糊集合中的參數(shù)如t₁、t₂、t₃、t₄、m₁、m₂、Δ1、Δ2，由用戶(hù)通過(guò)歷史經(jīng)驗(yàn)確定。
　　“much-bigger-than, bigger-than, close-to, smaller-than, much-smaller-than”等概念也用模糊集合表示，如圖5。

　　這些模糊集合中的參數(shù)cj(1≤j≤8)可以表示為c_i和Δ的函數(shù)，而這些函數(shù)也可以由用戶(hù)根據(jù)經(jīng)驗(yàn)指定。
　　根據(jù)推理規(guī)則庫(kù)和Sugeno模糊推理算法，可以得到一個(gè)三角模糊數(shù)，設(shè)為C=(m_c,θ_c,χc)，其中m_c是中心，θc 和χc是左右距離。假設(shè)用戶(hù)指定的置信水平為α，則C的α-截集C_α如圖6所示。

　　最后，Coordinator從這個(gè)α-截集中隨機(jī)選取一個(gè)值，作為新的讓步幅度，并通知sub-negotiator。sub-negotiator根據(jù)新的讓步幅度，產(chǎn)生一個(gè)新的提議給協(xié)商對(duì)手。
3 實(shí)驗(yàn)
　　將本文中的協(xié)調(diào)策略FCS(Fuzzy technique-based Coordinating Strategy）與eCN^[3]和OP^[2]進(jìn)行比較，結(jié)果如圖7和圖8所示。

　　圖7比較了三種協(xié)調(diào)策略可獲得的效用。可以看出，當(dāng)協(xié)商對(duì)手的數(shù)目不多(小于等于25)，本文的FCS策略是最優(yōu)的。當(dāng)協(xié)商對(duì)手?jǐn)?shù)目超過(guò)25，eCN策略是最優(yōu)的， FCS策略緊隨其后。
　　由圖8，使用本文的FCS策略，協(xié)商時(shí)間大大減少；而且協(xié)商對(duì)手越多，這種時(shí)間節(jié)省的效果就越明顯。當(dāng)協(xié)商對(duì)手?jǐn)?shù)目超過(guò)20，F(xiàn)CS策略的協(xié)商時(shí)間不足eCN和OP的一半。
　　因此，當(dāng)協(xié)商對(duì)手?jǐn)?shù)目不是很多時(shí)，本文基于模糊推理的協(xié)調(diào)策略無(wú)論是在效用，還是在時(shí)間上，都具有更好的表現(xiàn)。當(dāng)協(xié)商對(duì)手的數(shù)目較多時(shí)，本文的協(xié)調(diào)策略雖然在效用上表現(xiàn)不是最優(yōu)，但是協(xié)商時(shí)間大大減少。這尤其適用于時(shí)間有限的協(xié)商場(chǎng)景。
　　本文重點(diǎn)研究了一對(duì)多協(xié)商中協(xié)調(diào)者使用的對(duì)多個(gè)并發(fā)的一對(duì)一協(xié)商進(jìn)行協(xié)調(diào)的協(xié)調(diào)策略。為了在信息不完全的環(huán)境中對(duì)多個(gè)協(xié)商線(xiàn)程進(jìn)行有效的協(xié)調(diào)，協(xié)調(diào)策略使用了模糊規(guī)則和模糊推理技術(shù)。實(shí)驗(yàn)證明，該協(xié)調(diào)策略在動(dòng)態(tài)不確定環(huán)境中，能夠在縮短協(xié)商時(shí)間、提高協(xié)商效率的同時(shí)，保證協(xié)商主體獲得較高的效用。

參考文獻(xiàn)
[1] ?LOMUSCIO A R，WOOLDRIDGE M， JENNINGS N R. A?classification scheme for negotiation in electronic commerce[J].Int J of Group Decision and Negotiation，2003，12(1):31-56.
[2] ?RAHWAN I，KOWALCZYK R，PHAM H H. Intelligent?agents for automated one-to-many e-commerce negotiation
?[C].Twenty-Fifth Australian Computer Science Conference，2002:197-204.
[3] ?NGUYEN T D， JENNINGS N R. Coordinating multiple?concurrent negotiations[C]. Proc 3rd Int Conf on
?Autonomous Agents and Multi-Agent Systems，New York，USA，2004:1064-1071.
[4] ?孫天昊，朱慶生，李雙慶. 一對(duì)多協(xié)商協(xié)調(diào)策略[J].?計(jì)算機(jī)工程與應(yīng)用，2007,43(3):230-233.
[5] ?KWANG M S,CHUNG Y C. Agents that react to changing??market situations[J]. IEEE Transactions on Systems, Man?and Cybernetics, Part B, 2003,33(2):188-201.

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀(guān)點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題，請(qǐng)及時(shí)通過(guò)電子郵件或電話(huà)通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話(huà)：010-82306118；郵箱：[email protected]。

一對(duì)多協(xié)商協(xié)調(diào)策略研究

日期： 2009-07-07

作者：姚永雷, 馬 利

相關(guān)內(nèi)容

作者：姚永雷, 馬利