呼叫中心技術及其發(fā)展
王琦
中國電信集團北京研究院技術部
摘要: 一般看來呼叫中心似乎是企業(yè)在最外層加上了一個服務層,,實際上它不僅僅為外部用戶,,也為整個企業(yè)內部的管理,、服務,、調度、增值起到非常重要的統(tǒng)一協(xié)調作用……
Abstract:
Key words :
1 引言
現(xiàn)代呼叫中心是一種基于CTI技術,、充分利用通信網和計算機網的多項功能集成,,并與企業(yè)連為一體的一個完整的綜合信息服務系統(tǒng),利用現(xiàn)有的各種先進的通信手段,,有效地為客戶提供高質量,、高效率、全方位的服務,。一般看來呼叫中心似乎是企業(yè)在最外層加上了一個服務層,,實際上它不僅僅為外部用戶,也為整個企業(yè)內部的管理,、服務,、調度、增值起到非常重要的統(tǒng)一協(xié)調作用,。
2 呼叫中心概述
中國引入呼叫中心的概念在20世紀90年代中后期,,1998年以前,中國呼叫中心產業(yè)主要集中在電信業(yè)的一些服務領域,,1998年以后,,對信息化應用程度較高的行業(yè),如銀行,、證券,、保險和以服務導向為驅動的市場化行業(yè),如IT業(yè),、家電、遠程購物等行業(yè)也開始不同程度的應用呼叫中心提供服務,。
隨著呼叫中心技術的成熟和功能的發(fā)展,,金融,、電信、大型企業(yè)等行業(yè)對于呼叫中心均加大了投入,,而且已經成為企業(yè)整體發(fā)展戰(zhàn)略不可或缺的組成部分,,其在企業(yè)中的角色也逐漸從成本中心演變?yōu)闃I(yè)務平臺和贏利中心。
呼叫中心的發(fā)展大致經歷了如下三個階段:
第一代:熱線電話,。該方式實現(xiàn)簡單,,但是功能單一,擴展性差,。
第二代:計算機+板卡,。基于板卡的呼叫中心是由系統(tǒng)集成商按照客戶的具體需求,,將不同廠家的板卡集成到一個系統(tǒng)中,,按照客戶要求的專項定制,其成本低廉,、設計靈活,,但其實現(xiàn)的功能較專用,功能的升級以及規(guī)模的穩(wěn)定性難于保障,。
中國引入呼叫中心的概念在20世紀90年代中后期,,1998年以前,中國呼叫中心產業(yè)主要集中在電信業(yè)的一些服務領域,,1998年以后,,對信息化應用程度較高的行業(yè),如銀行,、證券,、保險和以服務導向為驅動的市場化行業(yè),如IT業(yè),、家電、遠程購物等行業(yè)也開始不同程度的應用呼叫中心提供服務,。
隨著呼叫中心技術的成熟和功能的發(fā)展,,金融,、電信、大型企業(yè)等行業(yè)對于呼叫中心均加大了投入,,而且已經成為企業(yè)整體發(fā)展戰(zhàn)略不可或缺的組成部分,,其在企業(yè)中的角色也逐漸從成本中心演變?yōu)闃I(yè)務平臺和贏利中心。
呼叫中心的發(fā)展大致經歷了如下三個階段:
第一代:熱線電話,。該方式實現(xiàn)簡單,,但是功能單一,擴展性差,。
第二代:計算機+板卡,。基于板卡的呼叫中心是由系統(tǒng)集成商按照客戶的具體需求,,將不同廠家的板卡集成到一個系統(tǒng)中,,按照客戶要求的專項定制,其成本低廉,、設計靈活,,但其實現(xiàn)的功能較專用,功能的升級以及規(guī)模的穩(wěn)定性難于保障,。
第三代:基于CTI,,排隊機+計算機網絡+三層數(shù)據(jù)庫訪問結構?;谝惑w化的呼叫中心既有電信級的穩(wěn)定性和強大的交換功能,,又有開發(fā)實施便捷和成本相對較合理的優(yōu)點。隨著越來越多的企業(yè)應用呼叫中心,,企業(yè)面臨著如何使呼叫中心在技術發(fā)展上更進一步的問題?,F(xiàn)代通訊系統(tǒng)技術、互聯(lián)網技術和交互式視頻信號系統(tǒng)的發(fā)展將作用于呼叫中心,,使其向著智能化,、個人化、多媒體化,、網絡化,、移動化發(fā)展?;ヂ?lián)網呼叫中心,、多媒體呼叫中心以及虛擬呼叫中心在未來中國市場,也將隨著企業(yè)對呼叫中心認識程度的進一步提高,、客戶關系管理市場及設備制造商的全力推動而得到推廣,。
新一代呼叫中心的系統(tǒng)結構如圖1所示。
3 呼叫中心關鍵技術
雖然隨著技術的進展Web,、E-mail,、傳真等多種接入方式出現(xiàn),,但就實際應用而言,這些先進的接入方式應用得還很少,,傳統(tǒng)的電話接入處理和IVR應答仍然是使用率最高的技術方式,。所以,可以將語音和數(shù)據(jù)融合的技術就成為呼叫中心的關鍵技術,,最重要的主要有如下三種:文語轉換(TTS)技術,、語音識別(ASR)技術和Voice
XML。這幾種技術對呼叫中心的自動語音服務和電話與計算機,、Internet的結合起著至關重要的作用,。
3.1 TTS技術
語音合成,又稱為文語轉化(Text-to-Speech),,涉及聲學,、語言學、數(shù)字信號處理,、多媒體等多種學科,,是中文信息處理領域的一項前沿技術。語音合成技術解決的主要問題是:如何將電子化文本的文字信息轉化為能夠播放的聲音信息,。近代語音合成技術是隨著計算機技術和數(shù)字信號處理技術的發(fā)展而發(fā)展起來的,,目的是讓計算機能夠產生高清晰度、高自然度的連續(xù)語音,,近幾十年來國際和國內的研究主要集中在按規(guī)則文語轉換,,即將書面語言轉換成口頭語言。
在語音合成技術應用之前,,錄音回放一直是呼叫中心自動語音服務中所采用的主要手段,,但是隨著多媒體信息需求的增大,語音服務系統(tǒng)中近年來應用TSS技術得到了迅速發(fā)展,。
TSS和錄音回放相比具有以下優(yōu)勢:
(1)就工作量而言,,錄音需要大量的人力,在信息量以幾何級數(shù)增長的今天,,錄音往往無法滿足信息的供給,,而語音合成將絕大多數(shù)工作由機器代替,人們只需提供現(xiàn)成的文本信息即可輸出聲音信息,。
(2)對于動態(tài)的信息,,尤其是對實時性要求很高的信息,如股票行情等,,如果讓錄音員錄音則至少在半小時后才能對外提供,,而語音合成可以實現(xiàn)實時的轉換,每分鐘可刷新一次。
(3)由于信息的高速增長,,錄音數(shù)據(jù)存放和查詢也存在問題,。將信息以文本形式存儲在計算機中可節(jié)約大量系統(tǒng)資源再結合計算機技術對數(shù)據(jù)庫中的信息進行搜索和整理將輸出的結果用語音合成轉換成聲音,這樣就可以解決信息服務中海量信息的存儲和查詢的問題,。
(4)錄音的信息維護、修改的工作量比較大,。而文本信息的維護和修改相對要容易得多,,通過語音合成技術只需對文本信息進行修改就可以完成信息內容的更改和維護工作。
新一代呼叫中心的系統(tǒng)結構如圖1所示。
3 呼叫中心關鍵技術
雖然隨著技術的進展Web,、E-mail,、傳真等多種接入方式出現(xiàn),,但就實際應用而言,這些先進的接入方式應用得還很少,,傳統(tǒng)的電話接入處理和IVR應答仍然是使用率最高的技術方式,。所以,可以將語音和數(shù)據(jù)融合的技術就成為呼叫中心的關鍵技術,,最重要的主要有如下三種:文語轉換(TTS)技術,、語音識別(ASR)技術和Voice
XML。這幾種技術對呼叫中心的自動語音服務和電話與計算機,、Internet的結合起著至關重要的作用,。
3.1 TTS技術
語音合成,又稱為文語轉化(Text-to-Speech),,涉及聲學,、語言學、數(shù)字信號處理,、多媒體等多種學科,,是中文信息處理領域的一項前沿技術。語音合成技術解決的主要問題是:如何將電子化文本的文字信息轉化為能夠播放的聲音信息,。近代語音合成技術是隨著計算機技術和數(shù)字信號處理技術的發(fā)展而發(fā)展起來的,,目的是讓計算機能夠產生高清晰度、高自然度的連續(xù)語音,,近幾十年來國際和國內的研究主要集中在按規(guī)則文語轉換,,即將書面語言轉換成口頭語言。
在語音合成技術應用之前,,錄音回放一直是呼叫中心自動語音服務中所采用的主要手段,,但是隨著多媒體信息需求的增大,語音服務系統(tǒng)中近年來應用TSS技術得到了迅速發(fā)展,。
TSS和錄音回放相比具有以下優(yōu)勢:
(1)就工作量而言,,錄音需要大量的人力,在信息量以幾何級數(shù)增長的今天,,錄音往往無法滿足信息的供給,,而語音合成將絕大多數(shù)工作由機器代替,人們只需提供現(xiàn)成的文本信息即可輸出聲音信息,。
(2)對于動態(tài)的信息,,尤其是對實時性要求很高的信息,如股票行情等,,如果讓錄音員錄音則至少在半小時后才能對外提供,,而語音合成可以實現(xiàn)實時的轉換,每分鐘可刷新一次。
(3)由于信息的高速增長,,錄音數(shù)據(jù)存放和查詢也存在問題,。將信息以文本形式存儲在計算機中可節(jié)約大量系統(tǒng)資源再結合計算機技術對數(shù)據(jù)庫中的信息進行搜索和整理將輸出的結果用語音合成轉換成聲音,這樣就可以解決信息服務中海量信息的存儲和查詢的問題,。
(4)錄音的信息維護、修改的工作量比較大,。而文本信息的維護和修改相對要容易得多,,通過語音合成技術只需對文本信息進行修改就可以完成信息內容的更改和維護工作。
目前TTS技術已經十分成熟,,現(xiàn)在的研究主要集中在生成的漢語語音的清晰度和自然度上,,而且通過一些參數(shù)做到語氣語調的調整,使得語音更接近真人播音,。
3.2 ASR技術
語音識別的研究工作大約開始于20世紀50年代,,當時AT&;T Bell實驗室實現(xiàn)了第一個可識別10個英文數(shù)字的語音識別系統(tǒng),?Audry系統(tǒng),。在隨后的幾十年間實驗室的研究一直處于不斷進展中,但是畢竟語音識別是一項復雜的技術,,特別對于漢語語音識別尤其如此,,因此,盡管多年前就有眾多公司和研究機構開始了語音識別技術的研究,,但直到最近幾年,,在國內才開始出現(xiàn)商業(yè)化產品。
應用于呼叫中心領域的語音識別技術有別于一般PC系統(tǒng)所使用的語音識別技術,,其面臨的困難體現(xiàn)為:電話錄音質量差,,識別率要求高,系統(tǒng)不能對電話用戶進行訓練,;另外,,系統(tǒng)還要能夠完成大量用戶語音數(shù)據(jù)的并發(fā)識別請求,這就對應用于呼叫中心領域的語音識別技術在功能和性能上要有更高要求,。由于存在上面列舉的種種困難,,使得應用于呼叫中心領域的ASR技術不可能像應用于PC的ASR技術一樣,能夠隨心所欲地識別用戶所說的任何詞匯,。目前基于電話的語音識別應用主要是非特定人的命令識別,,該技術的應用有效的解決了電話用戶按鍵輸入范圍有限,操作不方便的問題,。目前ASR的廠商均支持中文普通話,、英文的識別,而且只要普通話標準,,識別正確率可以達到90%以上,,部分廠商支持中英文混讀和其它語種(主要是粵語)的識別,。
但是目前ASR技術在實際應用中仍舊存在的主要問題是漢語的方言多種多樣,口音千差萬別,,很多地方的普通話說得很不標準,,給識別帶來很大困難。
3.2 ASR技術
語音識別的研究工作大約開始于20世紀50年代,,當時AT&;T Bell實驗室實現(xiàn)了第一個可識別10個英文數(shù)字的語音識別系統(tǒng),?Audry系統(tǒng),。在隨后的幾十年間實驗室的研究一直處于不斷進展中,但是畢竟語音識別是一項復雜的技術,,特別對于漢語語音識別尤其如此,,因此,盡管多年前就有眾多公司和研究機構開始了語音識別技術的研究,,但直到最近幾年,,在國內才開始出現(xiàn)商業(yè)化產品。
應用于呼叫中心領域的語音識別技術有別于一般PC系統(tǒng)所使用的語音識別技術,,其面臨的困難體現(xiàn)為:電話錄音質量差,,識別率要求高,系統(tǒng)不能對電話用戶進行訓練,;另外,,系統(tǒng)還要能夠完成大量用戶語音數(shù)據(jù)的并發(fā)識別請求,這就對應用于呼叫中心領域的語音識別技術在功能和性能上要有更高要求,。由于存在上面列舉的種種困難,,使得應用于呼叫中心領域的ASR技術不可能像應用于PC的ASR技術一樣,能夠隨心所欲地識別用戶所說的任何詞匯,。目前基于電話的語音識別應用主要是非特定人的命令識別,,該技術的應用有效的解決了電話用戶按鍵輸入范圍有限,操作不方便的問題,。目前ASR的廠商均支持中文普通話,、英文的識別,而且只要普通話標準,,識別正確率可以達到90%以上,,部分廠商支持中英文混讀和其它語種(主要是粵語)的識別,。
但是目前ASR技術在實際應用中仍舊存在的主要問題是漢語的方言多種多樣,口音千差萬別,,很多地方的普通話說得很不標準,,給識別帶來很大困難。
此內容為AET網站原創(chuàng),,未經授權禁止轉載,。