作者從自己的實(shí)際工作出發(fā),,以兒童機(jī)器人場景為例,,從多個角度對如何構(gòu)建閑聊機(jī)器人進(jìn)行了闡述,,并分享了與機(jī)器人“吹水的”價值、方式方法以及背后原理,。
一,、機(jī)器人概述
機(jī)器人按照對話方式,可以分為“問答機(jī)器人”,、“任務(wù)對話機(jī)器人”,、“開放閑聊機(jī)器人”。但機(jī)器人的落地使用過程中,,往往需要不同作用的機(jī)器人進(jìn)行結(jié)合,。
拿電器類客服機(jī)器人舉例來說,會有如下對話:
用戶:“包安裝嗎”
機(jī)器人:”我們是包安裝的哦,,親“
以上是我們最常見的問答場景,,機(jī)器人通過檢索方式,找出query對應(yīng)的answer返回給用不,。
再比如:
用戶:“我要查物流”
機(jī)器人:“您要查詢的是哪個訂單”(提供訂單A&訂單B&訂單C)
用戶:選擇A
機(jī)器人:該貨品目前已經(jīng)由順豐發(fā)出,。
在以上場景中,機(jī)器人需要通過多輪方式完成查物流的任務(wù),。
這就像咱人一樣,,在工作中,不僅需要有決策和解決問題的能力,,還需要有日常溝通能力,,任何一項(xiàng)都是不可或缺的,。
由于工作中接觸了各類機(jī)器人,對于開放域聊天內(nèi)容的感觸比較深的是,,閑聊本身在機(jī)器人的場景中,,作用會相對弱一些,但大部分時候,,又屬于機(jī)器人的基本能力,,屬于典型的“得不到的永遠(yuǎn)在騷動,得到的有恃無恐”,。
而目前市面上的機(jī)器人介紹文檔,,一方面關(guān)于閑聊的內(nèi)容不多,絕大部分是任務(wù)型和檢索性的文章,;另一方面,,閑聊的介紹更偏向于技術(shù)實(shí)現(xiàn)方式。但小七我認(rèn)為,,想要做好開放域聊天,,其實(shí)不能只考慮技術(shù)實(shí)現(xiàn),而應(yīng)該從產(chǎn)品本身出發(fā),。
所以今天,,小七結(jié)合之前做開放域機(jī)器人的實(shí)操過程,主要以兒童機(jī)器人場景為例子,,從不同角度來闡述如何構(gòu)建閑聊機(jī)器人,,跟著我燥起來!
二,、吹水的價值
閑聊,,俗稱“吹水”。朋友間吹水,,講究開心就好,。所以,閑聊是一個雙方都帶有情感訴求的過程,,可以是解悶逗樂,,也可以是哭訴慰藉。
基于此,,如果用戶與機(jī)器人進(jìn)行閑聊互動,,必定是希望機(jī)器人能引起其情感的共鳴和變化。如下對話是用戶跟“小愛同學(xué)”(小米音箱)的對話:
用戶:小愛同學(xué),,放個屁
robot:矮油,,人家是女孩紙,怎么會做這么羞羞的事情。既然主人想要聽放屁,,我就勉為其難放一個,,放的不好可不許怪我哦。
噗~~
用戶在這次對話中,,讓小愛同學(xué)放屁,,純粹是逗樂找趣。同時,,機(jī)器人的反應(yīng)也是有一定套路,,讓用戶感受到,這是一個可以給自己帶來樂趣的朋友,。
當(dāng)一個朋友情商特別高,,能夠在自己傷心時給予安慰,無聊時帶來樂趣,,開心時互相分享,,任何一個人都會很感激有這樣的益友,讓人離不開,。
比如用戶面前有一個娛樂機(jī)器人,,前者習(xí)慣性會以人與人交流的形式來進(jìn)行對話。這時候,,機(jī)器人不能而不是“直男”,,顧著解決問題,,也應(yīng)該是一個情商高的朋友,,感知用戶的情感,并在回復(fù)時伴隨著相應(yīng)的情感,,讓用戶感受到樂趣和溫度,。
只有這樣子,用戶才能與機(jī)器人做更多交互,,提高用戶粘性,,而不是“仰天嘲笑出門去,AI都是智障人”,?
三,、如何吹水
用戶如果有意和機(jī)器人扯犢子吹水,必然會有”像人“的期望值,。這個標(biāo)準(zhǔn)說起來簡單,,做起來相當(dāng)?shù)秒y,畢竟nlp技術(shù)還真沒達(dá)到完全理解人類的水平,。
如果我們換個角度,,如《西部世界》中所講,機(jī)器人如果擁有了記憶,,便開始進(jìn)化成有意識的生物了,。同樣的,,對于【像人】(類似有意識)這個狀態(tài),我們可以抽象出一些特質(zhì),,機(jī)器人如果擁有了這些特征后,,能讓用戶覺得還不錯,愿意聊下去,。
那以下是筆者從過往做閑聊機(jī)器人過程中所抽象出的特質(zhì),,下面會一一做介紹。
1. 人設(shè)一致性
?。?)人設(shè)一致性的意義
每個社會人都有自己統(tǒng)一的人設(shè),,包括身份、性別,、形象,、性格、愛好等,,人與人之間也是基于這個“本”在對話,。即使是路上的陌生人問路,也會先根據(jù)對方的形象,、性別稱呼,,比如路上經(jīng)常有人找我問路,都會說:“你好,,帥哥”,。而這稱呼,本身就是一個人物設(shè)定的表現(xiàn),。如果一個人人設(shè)不一致,,有時候東,有時候西,,那要么是這個人太戲精,,要么就是神經(jīng)錯亂,比如下面這個人:
A:你是誰
B:我是來自廣東的產(chǎn)品經(jīng)理
A:那你平時工作都在干嘛
B:我在畫建筑設(shè)計(jì)圖,,敲代碼,,修空調(diào)。
A:(這恐怕是個假的產(chǎn)品經(jīng)理吧)
機(jī)器人也一樣,,需要立個人設(shè)在用戶前面,,才能讓后者有真實(shí)感,安全感,。如果機(jī)器人沒有人設(shè),,會讓聊天變得異常怪異。有時候回答不上來、有時候亂回答,,有時候上句不接下句,,用戶會認(rèn)為亂七八糟,溝通不了,。就如Cathy Pearl在《語言用戶界面設(shè)計(jì)》中所說:“人物模型的一致性,,使人們能夠在與它們溝通時得以預(yù)測接下來會發(fā)生什么”。
?。?)設(shè)計(jì)方式
那我們要如何設(shè)定機(jī)器人的人設(shè)呢,?平時我們要了解一個人,一般會從其背景信息出發(fā),,如名字,、家鄉(xiāng)、職業(yè),、愛好等,;其次,通過其談吐舉止,,也可以了解一個人的性格特征,。
關(guān)于機(jī)器人的背景,我們需要給到它一個故事,?!段鞑渴澜纭分校總€機(jī)器人都有自己的身份和劇本,。但用戶會問機(jī)器人的哪些背景信息呢,?事實(shí)是,不大可能枚舉出一個人的所有背景信息,,就連人都可能忘了自己很多以前的事兒,。
這里我們可以從日常提問(高頻問題)入手,。以兒童機(jī)器人為例,,在我們之前做的項(xiàng)目中,從線上交互數(shù)據(jù)看出,,咨詢機(jī)器人背景信息的query占了所有交互數(shù)據(jù)的10%以上,。這類問題包括:
機(jī)器人的身份是什么?姓名,、年齡,、生日、星座,、家鄉(xiāng)等
機(jī)器人的能力是什么,?
機(jī)器人的愛好是什么?
機(jī)器人的家庭背景、社交背景是怎么樣的,?
另一方面,,我們需要設(shè)計(jì)機(jī)器人的性格特點(diǎn),以此來體現(xiàn)其談吐,。性格特點(diǎn)可以是風(fēng)趣,、自信、忠誠,,亦或是調(diào)皮,、溫暖、腹黑,。
最終我們可以有這么一個故事:
我們要創(chuàng)造一個兒童機(jī)器人,,叫小七,男生,,獅子座,,關(guān)鍵很帥,來自泰坦星永恒一組,,由于星球?yàn)l臨滅絕,,爸爸媽媽送他到了地球,所以他留在地球和人類愉快地生活,。小七性格幽默,,樂于助人,但有時候也有些腹黑,,還有些喜歡掉書袋,,教育小朋友。
?。?)產(chǎn)品舉例
筆者也找了市面上做botframework的平臺,,這類產(chǎn)品的側(cè)重點(diǎn)主要在于技能定制及模型訓(xùn)練,而對于人設(shè)很少涉及,。后面發(fā)現(xiàn)以下兩個平臺有相關(guān)設(shè)定,,其中:圖靈機(jī)器人涉及到的屬性有性別、年齡,、星座,、爸爸媽媽;海知涉及的屬性包括姓名,、性別,、生日、喜好和爸爸媽媽,。人設(shè)內(nèi)容不多,,但這類機(jī)器人基礎(chǔ)配置,,還是必不可少的。
圖靈機(jī)器人人設(shè)頁面:
海知ruyi機(jī)器人人設(shè)頁面:
2. 語言風(fēng)格設(shè)定
?。?)意義與設(shè)計(jì)方式
語言風(fēng)格首先要符合人設(shè)特點(diǎn),。幽默的性格,機(jī)器人的回復(fù)就需要搞笑輕松一些,,若是嚴(yán)謹(jǐn)?shù)男愿?,機(jī)器人說話就需要嚴(yán)肅。想象一下,,一個在法院的政務(wù)機(jī)器人,,當(dāng)你問它你會啥的時候,它說會泡妞撩妹,,那場面真的會難以控制,。
比如前面提到的小七喜歡掉書袋,那我們可以在小孩子玩游戲很久之后,,提醒小朋友需要休息一下,,然后看看書,或者引導(dǎo)其來學(xué)習(xí)古詩詞,。
確定了語言風(fēng)格之后,,就需要將這種性格特點(diǎn)體現(xiàn)在機(jī)器人的對話中。我們可以從用戶所有query中,,抽象高頻場景進(jìn)行針對性設(shè)定,,使得機(jī)器人人設(shè)和說話風(fēng)格一致,更像一個人在聊天,,這也是我們最終的預(yù)期效果,。
而在這個過程中,為了讓機(jī)器人顯得更加擬人化,,我們也嘗試加入了一些類似口頭禪的feature,,比如有的人習(xí)慣以“呃”來開始,有的人喜歡說“然后”來銜接,。
?。?)產(chǎn)品舉例
在以往例子中,我們所發(fā)現(xiàn)的其中一個高頻場景是:用戶會重復(fù)問同一個問題(不知道是不是都是一些智能程度檢驗(yàn)師在聊天,,尷尬),。這種情況是極不建議機(jī)器人一直是單一回復(fù),那就成了一個對話復(fù)讀機(jī)了,。而微軟小冰對于用戶這種互動,結(jié)合了她自己的人設(shè)和語言風(fēng)格來回應(yīng)(比如:撒嬌,、傲氣),。
我們可以探索下微軟小冰的策略:
小冰的策略是,,針對同個問題,給出不同的回復(fù),。若用戶重復(fù)太多次,,小冰會有情緒的變化,慢慢地顯得不耐煩,,并且開始責(zé)怪用戶,,到最后干脆不回答了,直到用戶說其他內(nèi)容,,就回復(fù)“你終于不說重復(fù)的話啦~”,。從中我們可以看出,小冰的語言是很活動調(diào)皮并且較為傲嬌的,。
也只有這樣豐富的語言體現(xiàn),,用戶才更相信對面是個可以聊天的朋友,而不是一個無聊的智障機(jī)器人,。
3. 個性化
?。?)個性化意義
如同政治課本中的一句話:世界上不會有完全一樣的葉子。即使如雙胞胎,,也會有各自的個性,。我們過往發(fā)生的每件事情,讓我們形成了特有的世界觀,,價值觀,,人生觀。三觀決定了每個人的思想不同,,而語言是思想的折射,,從而讓每個人談吐都是與眾不同的。
相應(yīng)的,,機(jī)器人也應(yīng)該有自己的過往記憶,,從而形成自己與眾不同的三觀。 這樣,,每個機(jī)器人都是個性化的,,就跟我們不同性格的朋友一樣。
?。?)設(shè)計(jì)方式
當(dāng)然,,如果要記住所有的事情,對于機(jī)器人來說是困難的,,也會顯得沒有意義,,畢竟人也有記性差的時候。那機(jī)器人需要有什么記憶呢,?除了剛才的背景信息,,最重要的,,是要記住它的主人,即用戶,。
也就是說,,機(jī)器人需要能記住自己主人相關(guān)的信息,包括姓名,、性別,、愛好等方面,甚至某些過往的交互行為,。這樣,,當(dāng)某個用戶A擁有了一款能記住機(jī)子的機(jī)器人,即使市面上有其他機(jī)器人,,對用戶來說,,這個機(jī)器人小伙伴都是獨(dú)一無二的。
那要記住用戶,,首先得有個收集用戶畫像的過程,。這各場景就跟男生想要了解妹紙一樣,要么是自己主動了解(撩),,要么是自己通過細(xì)心觀察(備胎式方案),,被動了解。
1)主動了解型
如果機(jī)器人想主動去了解用戶,,就需要找準(zhǔn)時機(jī),,否則會顯得十分突兀,甚至讓用戶產(chǎn)生防備心理,。
一般來說,,最好的時機(jī),應(yīng)該是兩個朋友相互了解的時候,。具體我們可以看以下例子:
用戶:你叫什么名字呀,?
機(jī)器人:我叫小七。主人你呢,?
用戶:我叫小八,,你好呀。
機(jī)器人:你好,,小八,。我知道自己主人叫啥了,好開心,!
用戶:你會做什么呢,?
機(jī)器人:唱歌跳舞,啥都會呢,。小八,,你平時喜歡干什么呢,?
用戶:我也喜歡唱歌呢,。
機(jī)器人在這樣的互動中,,能夠了解到用戶的興趣愛好,并記憶下來,。而用戶也會覺得這個機(jī)器人真的像自己的玩伴,,從而更愿意與其玩下去。
2)細(xì)心觀察型
當(dāng)然,,如果機(jī)器人能夠細(xì)心留意用戶以往說的話,,也可以從中了解很多信息,從而做出很驚艷的交互表現(xiàn),。比如:
?。ㄔ缟希?/p>
用戶:早上好
機(jī)器人:早上好,小八,。今天周末天氣很好,,小八有打算去哪里玩嗎?
用戶:今天要跟爸爸媽媽去動物園,。
機(jī)器人:聽起來很棒呀,。要玩得開心哦
(晚上)
用戶:晚上好,。
機(jī)器人:小八呀,,今天去動物園玩了一天,能跟我講講都玩了什么了嗎
用戶:我今天看了斑馬,、獅子,、孔雀。,。,。。
機(jī)器人:好像很好玩呀,。下次小八帶著小七一起去,,好不好
機(jī)器人不僅能記憶,而且記性也好,,讓小朋友感覺真的有在關(guān)注自己,,也讓家長相信機(jī)器人確實(shí)是一個好陪伴,讓孩子不會孤單,。
通過這樣的記憶,,讓每個機(jī)器人都成為特有的存在。每個小朋友都有陪伴自己成長的專屬的玩伴,。
P.S.當(dāng)家里有兩個小朋友的時候,,如果希望機(jī)器人能夠記住用戶是誰,,我們也可以通過聲紋識別方式記住不同用戶的名稱。
4. 主動引導(dǎo)
?。?)意義
一個相對智能的吹水機(jī)器人算是擺在這里了,。但事實(shí)告訴我們,如果只是這樣,,用戶不會一直和他聊下去,。市面上很多機(jī)器人會宣稱自己有很多能力,可以陪伴小孩子,,還可以教小朋友數(shù)學(xué),、英語等等。咱先不說這些能力有沒有用,,好不好玩,,到底能不能被用戶觸發(fā),才是首要考慮的問題,。
想象一下,,兩個人在聊天,永遠(yuǎn)是其中一方在找話題,,另一方只是在附和,,就算話癆也不可能永遠(yuǎn)有話題。而且,,用戶往往不知道要和機(jī)器人聊啥,,尷尬的氣氛會讓前者失去聊下去的興趣。所以,,通過機(jī)器人主動引導(dǎo)來找話題,,從而讓用戶不斷來聊天,便顯得尤為重要,。
?。?)設(shè)計(jì)方式
設(shè)計(jì)主動引導(dǎo)的時候,產(chǎn)品經(jīng)理需要講究策略,,主要解決三個關(guān)鍵點(diǎn):內(nèi)容,、時機(jī)、話術(shù),。
1)引導(dǎo)內(nèi)容
選擇引導(dǎo)什么內(nèi)容,,這個取決于機(jī)器人的能力和定位,比如一個寓教于樂的機(jī)器人,,應(yīng)該多讓小朋友做數(shù)字游戲,、詩詞游戲等互動。同時,機(jī)器人如果學(xué)習(xí)(上線)了一些新的能力,,也需要及時引導(dǎo)用戶來體驗(yàn),,保證用戶的活躍度。
2)引導(dǎo)時機(jī)
對于時間點(diǎn)的問題,,我們可以選擇在開頭,、過程中以及結(jié)尾三個timing去觸發(fā)。
比較常見會在用戶喚醒機(jī)器人時候去引導(dǎo)其體驗(yàn)?zāi)芰?,如下case便是小度音箱在過年期間的能力引導(dǎo),,會在用戶開始閑聊之后,,直接推薦響應(yīng)技能,。
user:小度小度,晚上好
小度:晚上好呀,。先來看看明天的天氣吧,,稍后還有精彩節(jié)目等著你哦~
小度:明天天氣xxxxx
小度:我為您整理了一些收聽率很高的節(jié)目,聽聽看吧,,覺得不喜歡可以跟我說“換個臺”
但如果每次都在喚醒時引導(dǎo)就會顯得特別生硬,。我們想象一下,兩個朋友在扯皮吹水,,一般是從一個話題突然想到其他話題就開聊了,。同理,用戶跟機(jī)器人聊天,,也應(yīng)該允許雙方聊著聊著就扯到其他話題的,。
我們也不必在所有聊天內(nèi)容中去想辦法做話題引導(dǎo)。首先,,應(yīng)該找出用戶的高頻聊天場景中,,比如小朋友會經(jīng)常讓機(jī)器人講笑話,講完后就可以引導(dǎo)做其他寓教于樂的游戲,。當(dāng)然,,實(shí)際情況不可能如此簡單暴力,觸發(fā)條件需要做權(quán)重計(jì)算,,包括用戶各類技能的觸發(fā)次數(shù),、其他引導(dǎo)場景的觸發(fā)頻率、歷史引導(dǎo)的用戶反饋(如用戶說:我不喜歡)等,。
最后就是在結(jié)尾的timing做引導(dǎo),,也就是當(dāng)雙方都陷入沉默的尷尬氣氛的時候。拿小米音箱舉例,,由于是全雙工喚醒,,當(dāng)用戶每隔15s沒有說話,則會主動引導(dǎo)一次,連續(xù)三次引導(dǎo)無果才會退出喚醒狀態(tài),。比如:“主人你去哪兒了,?告訴你哦,我最近新學(xué)了一項(xiàng)技能,,要不要跟我一起玩呢”,。這樣可以引起用戶聊下去的興趣,開始新的話題,,保證cps的數(shù)據(jù)上漲,。
3)引導(dǎo)話術(shù)
至于最后的引導(dǎo)話術(shù),因?yàn)椴煌瑘鼍暗脑捫g(shù)是不一樣的,,所以要保證與我們先前講的語言風(fēng)格一致,,至少不能讓一個很嚴(yán)肅的學(xué)霸型機(jī)器人突然撒嬌說:“跟人家聊點(diǎn)別的東東嘛~”
5. 趣味性
所謂好看的皮囊千篇一律,有趣的靈魂萬里挑一,。說到底,,一個chatbot如果不好玩,再怎么折騰也沒用,。另一方面,,聊天機(jī)器人始終是一個To C的產(chǎn)品,通過運(yùn)營好玩的內(nèi)容,,保證活躍和留存是相當(dāng)重要的,。這往往能給到用戶意想不到的驚喜,從而產(chǎn)生持續(xù)對話的興趣,。
如何讓閑聊變得好玩,,就不得不提小冰的套路了。一方面,,小冰日常會更新技能,,不斷刺激用戶去體驗(yàn);另一方面,,也會在各種聊天中皮一皮,,讓用戶相信這是個有趣的“朋友”,比如上文提到的對于用戶故意使壞,,一直重復(fù)單句的場景,。
再比如,小冰曾經(jīng)更新一個“讀心術(shù)”的技能,,也就是在15個問題之內(nèi)猜出用戶心里想的人物是誰,。利用ID3決策樹等算法先將人物及特征作為訓(xùn)練樣本,再讓小冰反問用戶,,為每個特征分類,,最后選中用戶的“心上人”。
通過這一個個的小游戲,可以讓用戶不斷產(chǎn)生愉悅感及下次的期待感,,朋友之間也是這樣,,總有一些共同話題和興趣活動,才能讓雙方成為知己,。
之前設(shè)計(jì)閑聊機(jī)器人時,,小七也設(shè)定了某些套路策略。比如情人節(jié)前后的土味情話,,每天用戶開始進(jìn)行互動的時候,,以主動消息的方式來發(fā)土味情話。當(dāng)時每天的土味情話在情人節(jié)期間還是帶來了不少的留存和活躍的,。在實(shí)現(xiàn)方式上也比較簡單,,直接利用規(guī)則設(shè)定即可,ROI還是挺高的,。
user:打開聊天女仆
bot:主人你好呀,。啊,你有沒有聞到什么味道,?
user:沒有啊/什么味/…
bot:怎么你一出來空氣就甜炸了啊
同樣的,兒童機(jī)器人更需要這樣的趣味性和新鮮感,,畢竟兒童天性就是“喜新厭舊”,。如果小玩伴每天都是玩同樣的游戲,說同樣的話,,到最后一定“沒朋友”,。所以可以加入寓教于樂的兒童游戲,日常更新的兒童笑話,,兒童故事,,來吸引小朋友的注意,讓孩子喜歡上這個玩伴,。
6. 情感
根據(jù)馬斯洛的需求層次理論,,情感和歸屬(love and belonging)的需要是極為強(qiáng)烈的,缺乏該需求的人,,往往會因?yàn)闆]有感受到身邊人的關(guān)懷,,而認(rèn)為沒有價值活在這世界上。而對于開放域聊天機(jī)器人,,市場往往會將其定位為陪伴,,以提供一定程度的情感需求。因此,,如何讓機(jī)器人感知用戶的喜怒哀樂并做情感陪伴,,就有很大的必要性了。
這里分為兩塊,其一是如何識別用戶情緒,;其二是機(jī)器人如何做情感反饋,。
(1)情緒識別
我們暫不討論情感識別的技術(shù)識別,,而是從產(chǎn)品側(cè)分析機(jī)器人要識別哪些情緒,,從數(shù)據(jù)角度,就是劃分哪些數(shù)據(jù)作為情感分類,。
情感有很多種,,態(tài)度上有喜歡和討厭,心情上有悲傷和快樂,,人際上有疏遠(yuǎn)和冷漠,,等等。選擇哪些情感場景做反饋,,主要取決于兩點(diǎn):
機(jī)器人定位:比如兒童陪伴場景,,機(jī)器人對用戶的大部分情緒都應(yīng)該有敏感的識別,才能讓兒童感受到陪伴的意義,;而法律機(jī)器人的閑聊場景,,很多情感問題可以不用太注重,機(jī)器人選擇統(tǒng)一回復(fù)即可,。
機(jī)器人回復(fù)內(nèi)容的顆粒度:比如在兒童場景中,,小朋友罵了臟話,其實(shí)不需要了解具體罵的啥內(nèi)容,,都應(yīng)該先引導(dǎo)小朋友文明用詞,,所以臟話內(nèi)容的分類不需要太細(xì),只要是臟話就做統(tǒng)一回復(fù)即可,。
?。?)情感反饋策略
當(dāng)知道了用戶開心、失望還是憤怒的情緒之后,,身為“朋友”的機(jī)器人就需要有所回應(yīng),。針對不同的情緒分類,機(jī)器人可以有不同的策略,。這里我們可以列一下兒童場景中集中回復(fù)策略:
用戶生氣(說臟話):小朋友不可以說臟話哦,,這樣我就不想跟你玩了,我只想跟文明的小孩做朋友呢~(教育策略)
用戶生氣(無臟話):怎么了,?有人惹你不開心了嗎,?沒事,有小七陪著你舒緩心情呢~不如跟我一起聽首好聽的兒歌放松放松吧(引導(dǎo)兒童場景)
用戶失落:主人,,成長路上有不開心的事情,,也會有開心的事情呢~至少小七一直陪著主人,。對咯,我剛聽了一個笑話,,可笑死我了,,我也讓主人開心一下吧~(引導(dǎo)笑話場景)
用戶害怕:主人你抱著我,就沒啥好怕的了,,我們一起變勇敢,!
用戶開心:主人開心,小七就更開心啦,。但是,,但是,你要陪小七讀詩詞的呢,,不要忘了哦~(引導(dǎo)詩詞場景)
總而言之,,機(jī)器人的情感陪伴的最終效果,應(yīng)該是真正做到:不許騙我,、罵我,,要關(guān)心我;別人欺負(fù)我時,,你要在第一時間出來幫我,;我開心時,你要陪我開心,;我不開心時,,你要哄我開心。嗯,,最佳損友!
7. 特別說明:敏感詞處理
根據(jù)2017年國家頒布的《網(wǎng)絡(luò)安全法》第47條和68條的規(guī)定,,企業(yè)要保證自己的網(wǎng)絡(luò)運(yùn)營平臺內(nèi)容安全,,若出現(xiàn)敏感詞等違規(guī)行為將會收到行政處罰,甚至被勒令停業(yè)整改,。而作為聊天機(jī)器人的產(chǎn)品設(shè)計(jì)者,,需要保證機(jī)器人不亂說話,否則牽連成本巨大,。
所以一般我們會設(shè)計(jì)一個敏感詞庫,,并且做日常維護(hù)更新。有了敏感詞庫之后,,我們來看機(jī)器人的回復(fù)語料來源,,主要由三種渠道:(1)人工添加;(2)網(wǎng)上爬??;(3)自動生成,。對于(1)(2),我們會考慮在錄入回復(fù)的地方做敏感詞過濾,;而對于自動生成的回復(fù),,一般會在生成回復(fù)的時候,過濾掉敏感詞,。
嗯,,做個聰明的機(jī)器人,知道什么該說,,什么不該說,。
四、吹水是怎么練成的
這一章主要聊的是機(jī)器人的實(shí)現(xiàn)方式,,除非是算法類的產(chǎn)品經(jīng)理,,其他AI產(chǎn)品經(jīng)理的重點(diǎn)還在于用戶場景,所以這塊我們簡單聊一下即可(畢竟說了好多了,,在這段感情中累了),。
1. 檢索式閑聊實(shí)現(xiàn)
基于對話式檢索的閑聊主要使用匹配句子相似度的方式,比如先將用戶消息及對話庫的分類轉(zhuǎn)換為句向量,,再計(jì)算兩者之間的余弦距離以得到語義相似度,,最終將相似度最高的分類對應(yīng)回復(fù)話術(shù)返回給用戶。
想要轉(zhuǎn)換為句向量,,由詞向量通過監(jiān)督方法或者無監(jiān)督方法獲得?,F(xiàn)在主流的詞向量模型有Word2Vec、BERT等,。當(dāng)獲得了詞向量之后,,可以通過各類模型獲得,如CNN,、跳躍思維向量,、快速思維向量。
整體流程可以概括為:
?。?)將query做分詞等預(yù)處理,,再通過Word2Vec、BERT等模型將分詞結(jié)果轉(zhuǎn)化為詞向量,,再利用快速思維向量,、跳躍思維向量等方式獲取句向量
(2)將生成的句向量與模型模型已經(jīng)處理過的分類匹配,,計(jì)算兩者余弦相似度,,獲得相似度分值;
?。?)根據(jù)分值排序,,選擇最佳相似問句,,將對應(yīng)answer返回。
當(dāng)然,,之前算法大大分享過:由于語料庫巨大,,如果每一條語料都與query計(jì)算,匹配效率會賊低,。所以可以用一個高效的搜索引擎做粗粒度的篩選,,選出候選答案,再進(jìn)行向量方式處理,。
2. 生成式閑聊實(shí)現(xiàn)
生成式聊天機(jī)器人采用端到端的深度學(xué)習(xí)模型,,如seq2seq,會從海量對話數(shù)據(jù)中學(xué)習(xí)到問題和回復(fù),,從而對每條query都自動生成回復(fù),。翻譯過來就是,回復(fù)內(nèi)容不必預(yù)設(shè),,全部讓機(jī)器人自己來生成,。
一般可以通過LSTM等模型將輸入的序列映射為固定長度的向量,然后使用深度LSTM從向量中解碼得到目標(biāo)輸出序列,。
業(yè)界的觀點(diǎn)中,,目前seq2seq的生成模型往往會出現(xiàn)安全回答的問題、機(jī)器人個性不一致的問題和多輪對話中的對話連續(xù)性問題,。我司算法大大跟我說過,,這類情況也不是沒辦法解決,一般會在生成模型中加入外部知識(如小冰的話題模型以及情感分類模型)來讓回復(fù)更有意義,。
當(dāng)然,,在小七的觀點(diǎn)中,生成模型不只是會出現(xiàn)這三個問題,,我們剛才講到的吹水策略,,才是閑聊機(jī)器人的重點(diǎn)價值體現(xiàn)。生成式雖然可以保證每條消息都能有所答復(fù),,但朋友間的閑聊,不在于有話必應(yīng),,而在于用心溝通,,用心交往。
當(dāng)然,,我也曾經(jīng)天真地設(shè)想過一個方案:利用檢索式滿足策略回復(fù)同時,,對于大量長尾的query,可以用生成回復(fù),,并引用情感等模型來保證回復(fù)內(nèi)容更有意義,,這個顧全大局但ROI賊低的方案活生生就被算法大大一句“天真”懟回來了,,哈哈哈哈哈~
五、怎么知道吹得好不好
當(dāng)我們將一個閑聊機(jī)器人構(gòu)建完成并且上線了,,不代表產(chǎn)品經(jīng)理的工作就完成了,。我們需要通過數(shù)據(jù),了解機(jī)器人吹水能力是不是OK的,,是不是真的達(dá)到用戶預(yù)期,。
平日里我們說一個人溝通能力強(qiáng),能夠和任何人談笑風(fēng)生,,但并沒有一個標(biāo)準(zhǔn),,往往都是主觀判斷。而機(jī)器人是一個產(chǎn)品,,產(chǎn)品經(jīng)理始終需要找到可以衡量價值的指標(biāo),,才能證明這個閑聊機(jī)器人是否真的滿足用戶需求。
如上圖所示,,從不同的目標(biāo)來看,,產(chǎn)品經(jīng)理需要關(guān)注不同的指標(biāo),比如我們設(shè)計(jì)了一款兒童陪伴硬件機(jī)器人,,從上往下都有不同的指標(biāo),。
對于企業(yè)來說,首先關(guān)注的就是好不好賣,。產(chǎn)品經(jīng)理就需要根據(jù)銷售量情況,,去設(shè)計(jì)場景和亮點(diǎn),保證產(chǎn)品側(cè)對銷售量的提升,。
從用戶角度來說,,產(chǎn)品經(jīng)理就需要關(guān)注其使用情況,大部門閑聊場景都是To C,,所以避免不了要關(guān)注留存,、活躍,也只有這兩個指標(biāo)上去了,,才能體現(xiàn)機(jī)器人陪伴的意義,。其次,我們也需要關(guān)注每次對話的輪次,,來了解用戶是否愿意聊下去,,也就是業(yè)界所說的CPS(單輪對話次數(shù))。
從功能來說,,產(chǎn)品經(jīng)理需要考慮每個技能的使用情況,,包括每個技能、場景的觸發(fā)率,、完成率,、留存率,。這類指標(biāo)可以說是對整體留存、活躍,、CPS的深層次現(xiàn)象探究,,比如哪些場景的觸發(fā)率高,從而提升了cps,;哪些技能完成率低,,導(dǎo)致整體活躍降低。
最后,,機(jī)器人是一個智能化系統(tǒng),,自身也應(yīng)該有一些客觀標(biāo)準(zhǔn)來衡量其智能化程度。因?yàn)槲覀冇懻摰闹饕腔跈z索式的閑聊系統(tǒng),,其常用評判標(biāo)準(zhǔn)有召回率,、精準(zhǔn)率和F-測度。
本文由 @steseven 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,,未經(jīng)作者許可,,禁止轉(zhuǎn)載。