呼叫中心技術(shù)及其發(fā)展-AET-電子技術(shù)應(yīng)用

呼叫中心技術(shù)及其發(fā)展

王琦

中國電信集團北京研究院技術(shù)部

摘要： 一般看來呼叫中心似乎是企業(yè)在最外層加上了一個服務(wù)層，實際上它不僅僅為外部用戶，也為整個企業(yè)內(nèi)部的管理、服務(wù)、調(diào)度、增值起到非常重要的統(tǒng)一協(xié)調(diào)作用……

關(guān)鍵詞： 呼叫中心 CTI TTS ASR

Abstract：

Key words :

1　引言

　　現(xiàn)代呼叫中心是一種基于CTI技術(shù)、充分利用通信網(wǎng)和計算機網(wǎng)的多項功能集成，并與企業(yè)連為一體的一個完整的綜合信息服務(wù)系統(tǒng)，利用現(xiàn)有的各種先進的通信手段，有效地為客戶提供高質(zhì)量、高效率、全方位的服務(wù)。一般看來呼叫中心似乎是企業(yè)在最外層加上了一個服務(wù)層，實際上它不僅僅為外部用戶，也為整個企業(yè)內(nèi)部的管理、服務(wù)、調(diào)度、增值起到非常重要的統(tǒng)一協(xié)調(diào)作用。

      2　呼叫中心概述

　　中國引入呼叫中心的概念在20世紀90年代中后期，1998年以前，中國呼叫中心產(chǎn)業(yè)主要集中在電信業(yè)的一些服務(wù)領(lǐng)域，1998年以后，對信息化應(yīng)用程度較高的行業(yè)，如銀行、證券、保險和以服務(wù)導(dǎo)向為驅(qū)動的市場化行業(yè)，如IT業(yè)、家電、遠程購物等行業(yè)也開始不同程度的應(yīng)用呼叫中心提供服務(wù)。

　　隨著呼叫中心技術(shù)的成熟和功能的發(fā)展，金融、電信、大型企業(yè)等行業(yè)對于呼叫中心均加大了投入，而且已經(jīng)成為企業(yè)整體發(fā)展戰(zhàn)略不可或缺的組成部分，其在企業(yè)中的角色也逐漸從成本中心演變?yōu)闃I(yè)務(wù)平臺和贏利中心。
   　　呼叫中心的發(fā)展大致經(jīng)歷了如下三個階段：
   　　第一代：熱線電話。該方式實現(xiàn)簡單，但是功能單一，擴展性差。

　　第二代：計算機+板卡。基于板卡的呼叫中心是由系統(tǒng)集成商按照客戶的具體需求，將不同廠家的板卡集成到一個系統(tǒng)中，按照客戶要求的專項定制，其成本低廉、設(shè)計靈活，但其實現(xiàn)的功能較專用，功能的升級以及規(guī)模的穩(wěn)定性難于保障。

　　第三代：基于CTI，排隊機+計算機網(wǎng)絡(luò)+三層數(shù)據(jù)庫訪問結(jié)構(gòu)。基于一體化的呼叫中心既有電信級的穩(wěn)定性和強大的交換功能，又有開發(fā)實施便捷和成本相對較合理的優(yōu)點。隨著越來越多的企業(yè)應(yīng)用呼叫中心，企業(yè)面臨著如何使呼叫中心在技術(shù)發(fā)展上更進一步的問題。現(xiàn)代通訊系統(tǒng)技術(shù)、互聯(lián)網(wǎng)技術(shù)和交互式視頻信號系統(tǒng)的發(fā)展將作用于呼叫中心，使其向著智能化、個人化、多媒體化、網(wǎng)絡(luò)化、移動化發(fā)展。互聯(lián)網(wǎng)呼叫中心、多媒體呼叫中心以及虛擬呼叫中心在未來中國市場，也將隨著企業(yè)對呼叫中心認識程度的進一步提高、客戶關(guān)系管理市場及設(shè)備制造商的全力推動而得到推廣。
   　　新一代呼叫中心的系統(tǒng)結(jié)構(gòu)如圖1所示。
       3　呼叫中心關(guān)鍵技術(shù)

　　雖然隨著技術(shù)的進展Web、E-mail、傳真等多種接入方式出現(xiàn)，但就實際應(yīng)用而言，這些先進的接入方式應(yīng)用得還很少，傳統(tǒng)的電話接入處理和IVR應(yīng)答仍然是使用率最高的技術(shù)方式。所以，可以將語音和數(shù)據(jù)融合的技術(shù)就成為呼叫中心的關(guān)鍵技術(shù)，最重要的主要有如下三種：文語轉(zhuǎn)換(TTS)技術(shù)、語音識別(ASR)技術(shù)和Voice
XML。這幾種技術(shù)對呼叫中心的自動語音服務(wù)和電話與計算機、Internet的結(jié)合起著至關(guān)重要的作用。
   　　3.1　TTS技術(shù)

　　語音合成，又稱為文語轉(zhuǎn)化(Text-to-Speech)，涉及聲學(xué)、語言學(xué)、數(shù)字信號處理、多媒體等多種學(xué)科，是中文信息處理領(lǐng)域的一項前沿技術(shù)。語音合成技術(shù)解決的主要問題是：如何將電子化文本的文字信息轉(zhuǎn)化為能夠播放的聲音信息。近代語音合成技術(shù)是隨著計算機技術(shù)和數(shù)字信號處理技術(shù)的發(fā)展而發(fā)展起來的，目的是讓計算機能夠產(chǎn)生高清晰度、高自然度的連續(xù)語音，近幾十年來國際和國內(nèi)的研究主要集中在按規(guī)則文語轉(zhuǎn)換，即將書面語言轉(zhuǎn)換成口頭語言。

　　在語音合成技術(shù)應(yīng)用之前，錄音回放一直是呼叫中心自動語音服務(wù)中所采用的主要手段，但是隨著多媒體信息需求的增大，語音服務(wù)系統(tǒng)中近年來應(yīng)用TSS技術(shù)得到了迅速發(fā)展。
   　　TSS和錄音回放相比具有以下優(yōu)勢：

　　(1)就工作量而言，錄音需要大量的人力，在信息量以幾何級數(shù)增長的今天，錄音往往無法滿足信息的供給，而語音合成將絕大多數(shù)工作由機器代替，人們只需提供現(xiàn)成的文本信息即可輸出聲音信息。

　　(2)對于動態(tài)的信息，尤其是對實時性要求很高的信息，如股票行情等，如果讓錄音員錄音則至少在半小時后才能對外提供，而語音合成可以實現(xiàn)實時的轉(zhuǎn)換，每分鐘可刷新一次。

　　(3)由于信息的高速增長，錄音數(shù)據(jù)存放和查詢也存在問題。將信息以文本形式存儲在計算機中可節(jié)約大量系統(tǒng)資源再結(jié)合計算機技術(shù)對數(shù)據(jù)庫中的信息進行搜索和整理將輸出的結(jié)果用語音合成轉(zhuǎn)換成聲音，這樣就可以解決信息服務(wù)中海量信息的存儲和查詢的問題。

　　(4)錄音的信息維護、修改的工作量比較大。而文本信息的維護和修改相對要容易得多，通過語音合成技術(shù)只需對文本信息進行修改就可以完成信息內(nèi)容的更改和維護工作。

　　目前TTS技術(shù)已經(jīng)十分成熟，現(xiàn)在的研究主要集中在生成的漢語語音的清晰度和自然度上，而且通過一些參數(shù)做到語氣語調(diào)的調(diào)整，使得語音更接近真人播音。
   　　3.2　ASR技術(shù)
　　語音識別的研究工作大約開始于20世紀50年代，當時AT&；T Bell實驗室實現(xiàn)了第一個可識別10個英文數(shù)字的語音識別系統(tǒng)？Audry系統(tǒng)。在隨后的幾十年間實驗室的研究一直處于不斷進展中，但是畢竟語音識別是一項復(fù)雜的技術(shù)，特別對于漢語語音識別尤其如此，因此，盡管多年前就有眾多公司和研究機構(gòu)開始了語音識別技術(shù)的研究，但直到最近幾年，在國內(nèi)才開始出現(xiàn)商業(yè)化產(chǎn)品。

　　應(yīng)用于呼叫中心領(lǐng)域的語音識別技術(shù)有別于一般PC系統(tǒng)所使用的語音識別技術(shù)，其面臨的困難體現(xiàn)為：電話錄音質(zhì)量差，識別率要求高，系統(tǒng)不能對電話用戶進行訓(xùn)練；另外，系統(tǒng)還要能夠完成大量用戶語音數(shù)據(jù)的并發(fā)識別請求，這就對應(yīng)用于呼叫中心領(lǐng)域的語音識別技術(shù)在功能和性能上要有更高要求。由于存在上面列舉的種種困難，使得應(yīng)用于呼叫中心領(lǐng)域的ASR技術(shù)不可能像應(yīng)用于PC的ASR技術(shù)一樣，能夠隨心所欲地識別用戶所說的任何詞匯。目前基于電話的語音識別應(yīng)用主要是非特定人的命令識別，該技術(shù)的應(yīng)用有效的解決了電話用戶按鍵輸入范圍有限，操作不方便的問題。目前ASR的廠商均支持中文普通話、英文的識別，而且只要普通話標準，識別正確率可以達到90%以上，部分廠商支持中英文混讀和其它語種(主要是粵語)的識別。
   　　但是目前ASR技術(shù)在實際應(yīng)用中仍舊存在的主要問題是漢語的方言多種多樣，口音千差萬別，很多地方的普通話說得很不標準，給識別帶來很大困難。

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容